第285章汉字的巨大环境-《我真不是科技大佬》
第(2/3)页
当然了,在具体的设置中,要是检测到造成歧义的可能性会很大,那就将之拉的更开,说不准造成阈值近了,意思的变化就会非常大,给出来的东西,看出错误不就更简单了吗?
当然了,这一起都是需要实践操作才能确定的,现在,还是要先统计,做一个庞大的词库,然后再转化为数据库。
这是一个不小的工程,而且,秦陆也顺便打算趁着这个过程,将华夏各地的方言,所有的文字,做成一本书。
可能,这本书的厚度会超过几米,但是,这将是堪比当年永乐大典的功绩。
对于华夏文化的传承,绝对是一个壮举。
要是没有贾维斯这样的人工智能,单凭人类自己,要想收集全,那是不可能的。
一时间,整个华夏几乎所有的电子设备全部被悄无声息的入侵,贾维斯开始依靠量子计算机的强大计算力,统计、测试、总结、汇编全华夏各个地方的方言的特色,将他们和相应的书面语对接起来,然后分类整理,再汇总整理。
这个过程,需要的时间不短,就算是量子计算机,也需要数据才能处理。
只有当设备周围的人说话的时候,才能将之采集下来,并且根据周围的其他人的表现,才能确定这句方言具体是什么意思。
而且,很多的方言词,在词典中是没有的,贾维斯询问了秦陆之后,直接开始造字。
甚至,有的音都是没有的,贾维斯也是直接造音,在元辅音范围拼写也拼不出来的音,贾维斯询问过秦陆之后,找专门的字母组合代替。
这个东西用作量子计算机的语言的话,完全是没有问题的,反正一切都是一个代码。
但是要是出版的话,那就需要语言专家来确定了。
这个东西,有的东西在语言专家的案子上是有的,只是我们不曾知道而已。
当然了,秦陆并不急。
这一切,都在缓缓的统计计算中,而秦陆,却是接到了周旭的电话,此时,正是秦陆回国之后的第二天下午。
“我说周大局长,你又有什么事儿啊,你知道不知道,我很忙的,我现在要做的事儿要是做好了,可能会得诺贝尔文学奖的!”秦陆道。
“屁,你一个搞科学的,去弄文学,你还让不让那些作家活了?”电话那头,周旭翻了翻白眼,道。
第(2/3)页