第285章汉字的巨大环境-《我真不是科技大佬》


    第(2/3)页

    当然了,在具体的设置中,要是检测到造成歧义的可能性会很大,那就将之拉的更开,说不准造成阈值近了,意思的变化就会非常大,给出来的东西,看出错误不就更简单了吗?

    当然了,这一起都是需要实践操作才能确定的,现在,还是要先统计,做一个庞大的词库,然后再转化为数据库。

    这是一个不小的工程,而且,秦陆也顺便打算趁着这个过程,将华夏各地的方言,所有的文字,做成一本书。

    可能,这本书的厚度会超过几米,但是,这将是堪比当年永乐大典的功绩。

    对于华夏文化的传承,绝对是一个壮举。

    要是没有贾维斯这样的人工智能,单凭人类自己,要想收集全,那是不可能的。

    一时间,整个华夏几乎所有的电子设备全部被悄无声息的入侵,贾维斯开始依靠量子计算机的强大计算力,统计、测试、总结、汇编全华夏各个地方的方言的特色,将他们和相应的书面语对接起来,然后分类整理,再汇总整理。

    这个过程,需要的时间不短,就算是量子计算机,也需要数据才能处理。

    只有当设备周围的人说话的时候,才能将之采集下来,并且根据周围的其他人的表现,才能确定这句方言具体是什么意思。

    而且,很多的方言词,在词典中是没有的,贾维斯询问了秦陆之后,直接开始造字。

    甚至,有的音都是没有的,贾维斯也是直接造音,在元辅音范围拼写也拼不出来的音,贾维斯询问过秦陆之后,找专门的字母组合代替。

    这个东西用作量子计算机的语言的话,完全是没有问题的,反正一切都是一个代码。

    但是要是出版的话,那就需要语言专家来确定了。

    这个东西,有的东西在语言专家的案子上是有的,只是我们不曾知道而已。

    当然了,秦陆并不急。

    这一切,都在缓缓的统计计算中,而秦陆,却是接到了周旭的电话,此时,正是秦陆回国之后的第二天下午。

    “我说周大局长,你又有什么事儿啊,你知道不知道,我很忙的,我现在要做的事儿要是做好了,可能会得诺贝尔文学奖的!”秦陆道。

    “屁,你一个搞科学的,去弄文学,你还让不让那些作家活了?”电话那头,周旭翻了翻白眼,道。
    第(2/3)页