跳转到主要内容

电脑沃森

100, what is waston?

Tab navigation

2011年 2月,IBM 电脑沃森将在 Jeopardy! 电视问答秀中对抗两位最大的全能冠军选手,让我们共同见证这一历史时刻。电脑沃森运行 IBM 研究中心开发的 Deep QA 软件。尽管这个项目的重大挑战是在 Jeopardy! 中获胜,但沃森的更大目标是创造新一代技术,以比标准搜索技术更有效的方式从非结构化数据中找出答案。

沃森在理解复杂问题并找出最佳答案方面表现优秀。IBM 的科学家们认为,沃森实际上并没有思考能力。15年来在 IBM 研究中心研究自然语言问题并从非结构化信息中寻找答案的 David Ferrucci 说:“我们的目标并非建立一个人脑模型,而是设计出一台能够更有效地理解自然语言并做出互动的电脑,而不一定与真人的行为方式相同。”

电脑从不善于寻找答案。搜索引擎不会回答问题–它们只是提供数千个与关键字匹配的搜索结果。长期以来,大学研究人员和企业工程师致力于开发问答软件,但最好的结果也只是理解并回答简单、直接的问题(伊丽莎白泰勒共获得多少次奥斯卡奖?),而且错误几率一般会达到近三分之一。这并没有太大用处,远远不能击败 Jeopardy! 冠军。

这个电视节目中的问题充满了微妙区别、双关语和脑筋急转弯— 这些方面能让真人感到兴奋,但电脑却对此无能为力。对于 Jeopardy! 节目提示“成就亚瑟米勒伟大戏剧的14世纪中有颜色的瘟疫”的正确回答是“什么是推销员的黑色死亡?”得出这个答案的唯一方式是将多个来源的信息综合在一起,因为确切的答案并不可能随处可见。

沃森运行于一组 Power 750™ 计算机上—十个机架容纳 90台服务器,共有 2880个处理器内核运行 DeepQA 软件和存储器。它的容量相当于大约一百万册书籍的信息。在多年内,沃森吸收了大量信息,包括商业信息文本,例如《世界百科全书》,而且包括允许随意复制的内容,例如维基百科和“古登堡计划”(Project Gutenberg) 的书籍。

在对沃森提出问题后,100多种算法会以不同方式分析问题,并寻找多个似乎准确的不同答案–所有这些都同时进行。而另一组算法对答案进行排序和打分。对于每个可能的答案,沃森将寻找可能支持或者反驳这个答案的证据。对于数百个可能的答案中的没一个,沃森都寻找一些证据,然后利用火速百种算法对证据支持答案的程度进行评分。具有最佳证据评估结果的答案将获得最高的可信度。评分最高的答案会成为最终答案。然而,在 Jeopardy! 节目中,如果评分最高的可能答案不足以为沃森提供足够的可信度,沃森会决定不按抢答器,并避免在打错时损失奖金的风险。电脑沃森在大约三秒内完成所有这些工作。

到 2010年末,在位于纽约约克城高地的 IBM 研究中心举行的节目演练中,沃森在找出正确答案方面表现优秀,在与 Jeopardy! 往届冠军的竞赛中,沃森获胜的几率大约是 70%。在 2011年初,沃森战胜了 Jeopardy! 超级明星 Ken Jennings 和 Brad Rutter。沃森采用的问答技术预计将实现商用。IBM 研究中心负责人 John Kelly 对《纽约时报》表示:“我希望创造出能够进入其它零售行业的产品,比如运输业。在时间至关重要而且需要向一线决策人提供先进信息的任何领域,电脑需要超越仅仅作为后端办公室计算机器的角色,而为决策人提供更好的智能化能力。”

IBM 专家

Christopher J. Nay

Christopher J. Nay,
通信专业研究员
Chris 是 IBM 沃森的社交网络经理。

电脑沃森

沃森是一个高效的分析引擎,它实时地将多个数据源汇总在一起,深入查看深层信息,并且解析出一个可信的答案。


新闻

了解 IBM 博客作者对沃森 - Jeopardy! 竞赛以及沃森沃森如何帮助构建智慧的地球的看法。


Content navigation