在上面的问题中,处理一个“不”还算比较清晰,但是在一些对准确性有要求的领域,会有很大的问题。
比如“无癌症证据”,到底是得到了没得癌症的证据,还是根本没有证据呢?
这还算是比较简单的,人类语言中还有很多双重否定,有时候连人自己表达的时候都会犯错。
处理这类问题,不能使用过去的统计方法,而需要更多关注语法内在的逻辑性,语言学中的乔姆斯基学派的研究者就是这么认为。
但是涉及此类算法的研究很少,甚至很多从事算法的人对此并不感兴趣。
一些从事机器学习研究的大型公司,他们研究的算法具有很大的适用性,但是在归因等情况下,他们的语言模型可能会失败。
而且神经网络尚未显示出对此问题的改进。在说“不”这个问题上,各家的AI都不能通过图灵测试,甚至显得愚蠢。
所以是不是“另有隐情”?
技术不行还是SEO捣乱
是不是因为谷歌没有在搜索引擎里用上NLP技术,所以才导致错误的结果?
实际上,谷歌去年10月就已经在英文版的搜索引擎里用上了BERT。
过去,谷歌的搜索更多的是基于单个单词的理解。
比如“2019 brazil traveler to usa need a visa”,以前的谷歌搜索会基于visa、usa、brazil这几个关键词,而英文结果里更多的是美国人咨询去巴西,所以搜索结果往往是相反的。
更新后的谷歌能够理解“to usa”的含义,才能识别正确的结果