★导读:15年前IBM的超级电脑"深蓝"击败世界国际象棋冠军加里・卡斯帕罗夫,这次IBM向人类的冠军发出挑战的超级电脑名叫 "沃森"。这部以IBM公司创始人名字命名的计算机,具备非常强大的计算功能,它在2月14日登上美国著名老牌智力游戏节目《危险边缘》挑战人类智力。沃森究竟是一台如何厉害的计算机?它是否能成功挑战人类记忆力?
★沃森是台很厉害的计算机
沃森是4年前IBM研发的一台能迅速回答涉及双关语和文字游戏等复杂问题的机器,"沃森"(Watson)是为了纪念IBM创始人 Thomas J. Watson而取的。IBM开发沃森旨在完成一项艰巨挑战:建造一个能与人类回答问题能力匹敌的计算系统。这要求其具有足够的速度、精确度和置信度,并且能使用人类的自然语言回答问题。这一系统没有连接至互联网,因此不会通过网络进行搜索,仅靠内存资料库作答。
2010年IBM公司计算机沃森参加智力比赛节目《危险边缘》。
沃森采用Linux操作系统和Power7处理器,内装2亿页新闻图书等资料
沃森由90台IBM服务器、360个计算机芯片驱动组成,是一个有10台普通冰箱那么大的计算机系统。这些服务器采用Linux操作系统。IBM为沃森配置的处理器是Power 7系列处理器,这是当前RISC(精简指令集计算机)架构中最强的处理器。它采用45nm工艺打造,拥有八个核心、32个线程,主频最高可达 4.1GHz,其二级缓存更是达到了32MB。存储了大量图书、新闻和电影剧本资料、辞海、文选和《世界图书百科全书》(World Book Encyclopedia)等数百万份资料。每当读完问题的提示后,"沃森"就在不到三秒钟的时间里对自己的数据库"挖地三尺",在长达2亿页的漫漫资料里展开搜索
“沃森”练习赛中险胜《危险边缘》冠军选手
沃森基于IBM研发的"深度问答"技术,采用上百种算法3秒内找出答案
沃森是基于IBM"DeepQA"(深度开放域问答系统工程)技术开发的。作为"沃森"超级电脑基础的 DeepQA技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。IBM研发团队为"沃森"开发的 100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成"答案"输出成人类语言。每一种算法都有其专门的功能。其中一种算法被称为"嵌套分解"算法,它可以将线索分解成两个不同的搜索功能。这听起来比较晦涩但却很实用。
例如:问"在(哥伦比亚广播公司)《60分钟》节目首次播出时,当时的美国总统是谁?"沃森首先要理解 "首次播出"是什么意思,以及与"首次播出"相关的日期;其次,它必须要弄清楚具体的《60分钟》节目首次播出的日期;然后它才能搜索到当时的美国总统是谁。简言之:它需要两个不同的搜索模块,一是搜索日期,一是搜索总统。当它得到一个可能答案的列表时,还须计算出哪一个最有信心符合标准。
沃森在比赛的时候并不需要接入互联网,而是利用多个算法应对竞赛中的挑战
沃森比谷歌更加智能:谷歌依赖人类,沃森自己处理全部问题
"沃森"超级计算机与谷歌搜索引擎相比究竟谁更智能?对于这一问题,美国《商业周刊》前科技编辑史蒂芬・贝克尔近日通过分析和比较后认为,"沃森"超级计算机比谷歌更智能。贝克尔认为,答案很简单,谷歌现在还不能回答问题。谷歌以两种方式信赖于我们人类的大脑:首先,在描述用户的查询请求时,谷歌会让用户像计算机一样去思考,挑选出三或四个最符合计算机意图的消息,形成一个查询结果列表。其次,谷歌会将用户引导到与所查询的答案类似的答案上去,让用户花更多的脑力去发现所需要查询的确切答案。而"沃森"超级计算机则是自己处理所有问题。它必须要解码复杂的英语,穷尽所有可能的答案,并选择其中一个,最终判定它是否足够符合要求。
★ 沃森如何应战智力游戏
对计算机沃森来说参与智力竞赛节目最重要的难题是解析人类的语言,尤其是在充满暗示和恶作剧的游戏里,沃森需要识别人类语言中微妙的含义,分辨讽刺口吻、谜语、构词断句、诗篇线索等等这些逻辑和线索。然后才是对题目进行分解,快速搜索自己的内存资料,寻找到最佳答案。为备战这次《危险边缘》的智力游戏,沃森的幕后团队对它进行了上百次陪练。
沃森是基于IBM"DeepQA"(深度开放域问答系统工程)技术开发的,作为"沃森"超级电脑基础的DeepQA技术可以读取数百万页文本数据。
沃森能学习人类思维分辨人类语言口气,可选择忽略不擅长的题目
对计算机沃森来说,挑选出合适的语境是一项艰巨任务,尤其是在充满暗示和恶作剧的游戏里,而且它还必须确定答案的可靠性以及它是不是需要冒险去猜。"沃森"需要识别人类的语言,并从中分析微妙的含义,讽刺口吻、谜语、构词断句、诗篇线索等等这些逻辑和线索,并通过一系列的数据比对和模拟人类的联想能力得出精准的答案,再反向用人类的语言回答出来。此外,沃森还能模仿人类针对问题进行策略考虑,例如问题的挑选、是否略过不擅长的题目,还会模仿人类的口吻搞笑整个过程仅有计算机和软件算法完成,没有工程师参与(这种快速问答,其实也参与不了),也与互联网断开因此计算机不能作弊,必须自己"想"。
沃森可估算节目剩余奖金和自我信心,主动选择是否继续回答问题
领导设计"沃森" 的IBM 研究团队的科学家David Ferrucci 博士表示:"经过四年的努力,我们的科学团队相信"沃森"已经能够快速理解《危险边缘》问题的内容,分析它需要获得的信息,得到精确的答案,并给出可信的回答。""沃森"会估计《危险边缘》节目组剩下的奖金数额、自己比其他对手落后或领先多少、自己在特定类别的题目上的表现,及时调整自己的信息级别。如果"沃森"落后对手太多,它的信心级别会较低,例如40%,这时它仍会继续努力;不过在领先对手时它也会想:"我已经领先那么多了,为什么还要冒险呢?" 因此,即使它的信心值是75%,它也有可能会选择不回答。
"沃森"会估计《危险边缘》节目组剩下的奖金数额、自己比其他对手落后或领先多少、自己在特定类别的题目上的表现,及时调整自己的信息级别。
沃森开战前多次被大规模评估系统,进行134次人机陪练比赛
在开发"沃森"的四年间,研发团队主要以两种方式评估这套系统。首先,他们以成批的方式(如每次3000个问题)进行大规模测试以评估系统性能,实施错误分析,提高系统性能。基于这种多问题的表现可以从统计学角度作出重要的性能评估;其次,该团队评估"沃森"的第二个方式是,与《危险边缘》以前的参赛选手进行"陪练"比赛。在2009年冬天,他们与曾经出现在《危险边缘》的选手进行了79场比赛,在刚刚过去的秋天,沃森与获得过《危险边缘》比赛冠军的选手进行了55场对决。这些陪练比赛让研发团队对沃森的性能有了深入认识。
★沃森为何选择参与智力游戏
沃森参加的人机对抗节目叫做《危险边缘》。这个智力竞赛游戏对选手提出了极高的要求。从常识到细小线索中语言的细微差异,都对选手提出了很高的要求。计算机系统通常只能执行精确的指令,IBM"沃森"能否凭借其强大的解析能力克服这些障碍?机器能否在由人类语言写出的知识 海洋中搜索到合适的信息,并给出唯一的精确答案?一场人机智力比赛能否帮助促进科学进步。
沃森要参与的人机对战节目叫做《危险边缘》,这是哥伦比亚广播公司益智问答游戏节目,已经历了数十年历史。
《危险边缘》是美国著名智力问答竞赛节目,涵盖面广泛回答形式独特
《危险边缘》是哥伦比亚广播公司益智问答游戏节目,已经经历了数十年历史。该节目的比赛以一种独特的问答形式进行,问题设置的涵盖面非常广泛,涉及到历史、文学、艺术、流行文化、科技、体育、地理、文字游戏等等各个领域。根据以答案形式提供的各种线索,参赛者必须以问题的形式做出简短正确的回。与一般问答节目相反,《危险边缘》以答案形式提问、提问形式作答。参赛者需具备历史、文学、政治、科学和通俗文化等知识,还得会解析隐晦含义、反讽与谜语等,而电脑并不擅长进行这类复杂思考。
例如,在某次节目中,参赛选手抽到了一个名为"小鸡喜欢我"(Chicks Dig Me)的类别。主持人读出提示:凯莎琳•肯扬(Kathleen Kenyon)挖掘的这个城市在《约书亚》(Joshua)中提到过,考古显示,这座城市的城墙曾修补过17次。"沃森"以一个模拟的男性声音正确地回答道:什么是耶利哥(Jericho)?
沃森的对手:肯-詹宁斯和布拉德-鲁特,他俩是《危险边缘》节目中最成功的选手。
IBM称利用该节目将推动技术向正确的方向发展
沃森的设计初衷则是要理解更为复杂的词句、语言和人类知识。IBM科学家、沃森团队的负责人大卫・费鲁奇 (David Ferrucci)表示,利用《危险边缘》去开发计算机系统"将推动技术向正确的方向发展"。他表示:"节目会问各种问题。这同时涉及到信心,当你认为你的答案不正确时不要回答。你还需要很快地做出判断。"IBM表示,赢得《危险边缘》比赛并不是主要目的。通过沃森的技术,医生可以更快地诊断病例,法律工作者也可以更快地研究案例。《危险边缘》执行制片人哈里・弗里德曼(Harry Friedman)表示:"这些很重要,我们希望成为其中的一部分。"
加拿大华人网 http://www.sinoca.com/