上周一,搜狗斥资4000万研发的机器狗汪仔首次亮相《一站到底》舞台便一举击败哈佛女学霸丰莉婷。节目播出之后,知乎高能网友便分析得出,二人对战过程中回答的问题多为此前节目中出现过的题目,汪仔对老问题总是百分百抢答正确。相反,汪仔答错或者回答速度输给人类的,都是之前节目中没有出现过的新问题。因此,网友怀疑搭载搜狗立知系统的汪仔可能只是背了《一站到底》的题库内容,而并非宣传中所说的人工智能答题。
(知乎网友归纳分析)
本周,历史再次重演。汪仔击败了拥有百万粉丝的网红元气小姐姐子望。值得注意的是,二人对战的前两道问题,汪仔均快速抢答成功,细心的网友发现,这两题分别于2015年和2013年在节目中出现过,汪仔背题库内容的痕迹依然明显。如下是问题与题库内容对比:
Q1:土耳其海峡连接的两片海域分别是黑海和哪片海?(正确答案:地中海;汪仔抢答正确)
(内容来自百度文库)
Q2:由司马光编撰,并被称为“帝王的镜子”的是哪本编年体史书?(正确答案:资治通鉴;汪仔抢答正确)
(内容来自百度文库)
令人不解的是,汪仔在面对“‘你无情,你冷酷,你无理取闹’,这句台词最早出自哪部电视剧?”的简单题目时却以“还珠格格”的回答而意外答错。然而,在网页版搜狗立知系统中提供的答案则是正确,且答案来源为2014年,远在汪仔诞生之前。这无疑与搜狗此前对外宣称汪仔具备语音识别、语义分析等能力背道而驰。
(内容来自搜狗搜索)
针对网友的质疑,搜狗公司CEO王小川曾亲自出面在在知乎做过简短的辩白,称:“一个case想说明什么呢?好些不在题库里的也有答案呀”,试图通过反问的方式堵住用户的嘴。
(知乎内容截图)
令人大跌眼镜的是,王小川的辩白只是障眼法。有网友抓包,上周被知友热烈关注的问题“搜狗参加‘一站到底’的机器人牛吗,和阿发狗下围棋哪个更厉害?”被知乎屏蔽了,在该问题之下,曾发生了疑似搜狗公关与知乎网友的口水战,而时隔一周该问题便被知乎屏蔽,而在搜索此问题时的相关内容均疑似搜狗公关所为,搜狗背后“搞猫腻”不言而喻。
(知乎搜索截图)
(知乎搜索截图)
除了问答题目有猫腻之外,节目主持人、选手与搜狗的对话也被质疑提前串词。从对话的识别准确度、反应速度和对话内容看来,“汪仔”在节目现场表现出了惊人的“智能”, 尤其是出场时调侃主持人、示爱选手的部分,似乎远超行业水平。然而,正是因为“太真了”,反而让人怀疑,什么样的训练数据能训练成这样?想来只有“背台本”能完美实现。来源:三门峡生活网