谷歌CEO专访畅谈AI革命：搜索、创新与网络生态的未来|TT球讯-2024欧洲杯分组

转载：https://new.qq.com/rain/a/20240616A00W2I00

2024-06-16 07:14·腾讯科技·发布于北京

划重点：

1
皮查伊讨论了谷歌搜索集成人工智能技术，如AI Overviews，旨在改善用户体验，提供更丰富的搜索结果。
2
谷歌正致力于多模态搜索功能，通过结合音频、视频、文本等多种形式，提供更全面的搜索服务。
3
皮查伊谈到幻觉问题，指出尽管人工智能在创造性方面表现出色，但准确事实性仍是一个待解决的问题。
4
皮查伊强调了网络生态系统正在经历的变革，以及谷歌在其中扮演的角色，包括对小型网站流量的潜在影响。
5
皮查伊讨论了谷歌如何通过搜索和Chrome等产品创造激励机制，以支持原创性、创造力和独立声音的发展。

腾讯科技讯据国外媒体报道，Alphabet兼谷歌首席执行官桑达尔·皮查伊（Sundar Pichai）近期参加Decoder播客节目，接受美国科技媒体网站专访，讨论了人工智能的最大进步、谷歌搜索的未来以及网络的命运。

在5月的谷歌I/O大会上，谷歌把焦点集中在了人工智能技术上--这家搜索巨头正在把人工智能技术融入其几乎所有产品中。其中，谷歌相册（Google Photos）新增的人工智能搜索功能尤为引人注目，它允许用户提出诸如“我的车牌号码是什么？”等问题，并能从用户的照片库中迅速找到答案。在主题演讲中，谷歌高管们共提及“人工智能”一词超过120次。

在I/O大会上，谷歌宣布推出名为“AI Overviews”的全新搜索体验功能。该功能将首先在美国上线，并计划在年底前推广至全球。谷歌宣称，这一功能能够对搜索结果进行智能总结，并提供由人工智能生成的答案。这被视作自谷歌搜索服务推出25年以来最重大的更新之一。谷歌形象地将此描述为“让谷歌为你搜索”。此前，谷歌已对该服务进行了为期一年的测试，称之为搜索生成体验。一些美国用户可能已经体验过这项服务的早期版本，而现在，这项真正改变我们所知网络世界的服务已经到来。

迄今为止，谷歌的生态系统一直基于链接到他人内容的模式：用户在搜索框中输入查询，看到链接，然后选择点击。在这种模式下，流量归属于各个网站，网站所有者能够通过多种方式实现流量变现。在最理想的情况下，每个人都能从中获益。谷歌无疑是目前网络上最大的流量来源，因此，如果它开始通过人工智能回答问题来保留流量，这可能会改变甚至摧毁我们所熟知的互联网生态系统。代表众多知名新闻出版商的新闻/媒体联盟发布了一份新闻稿，警告称搜索中的AI Overviews功能“将对我们的流量造成毁灭性打击”。

外媒近期在讨论“谷歌归零”政策（Google Zero），即，如果企业的谷歌流量降至零，他们的业务将如何发展。如果人工智能聊天机器人和人工智能驱动的搜索结果能够为用户总结一切，用户又为何需要访问网站？如果所有用户都停止访问网站，那么在网站上发布新内容的动机又是什么？是什么阻止了不怀好意的人试图操纵人工智能系统，利用人工智能生成的垃圾邮件充斥网络？如果人工智能最终扼杀了网络，当用户提出问题时，所有的聊天机器人将根据什么内容作出总结？

皮查伊对此有一些自己的看法。首先，他并不相信他深切关心的网络面临如此巨大的危险。在专访中，他提到了《连线》杂志2010年的著名文章《网络已死》（The Web is Dead），并指出，像人工智能这样的全新、变革性技术总是会引起一些短期性的破坏。他表示，将人工智能注入搜索是为了为用户创造价值，而用户的行为已经表明，这些新功能非常有用--甚至在AI Overviews中点击链接的频率更高。然而，皮查伊并未明确说明这对那些最初在互联网上发布内容的人意味着什么。

以下为专访内容全文（有删减）：

01.谷歌搜索融入AI新纪元

问：让我们欢迎Alphabet兼谷歌首席执行官桑达尔·皮查伊来到Decoder节目。

皮查伊：你好！非常荣幸能够参加这次的节目。

问：我非常期待与你的对话。感觉每年在谷歌I/O大会上，我们都能进行一次深入的交流，讨论谷歌公布的各项创新。今年，关于人工智能的新闻尤其令人兴奋。我对互联网的未来充满好奇，因此我非常渴望与你探讨这一主题。我想先从一个简单的问题开始。你认为语言等同于智能吗？

皮查伊：这个问题确实颇具挑战性！我并不认为自己是这一领域的权威。不过，我相信语言确实蕴含了丰富的智能，其深度和广度可能超出了我们的预期。它在很大程度上解释了大语言模型所取得的显著成就。但根据我的直觉，作为人类，我们处理信息的方式远比单纯的语言要复杂得多。不过，我必须说，语言的重要性远远超出了人们通常的认识。

问：提出这个问题的初衷在于，当我回顾谷歌I/O大会上发布的关于人工智能的产品和功能，以及谷歌所采取的行动，当观察到其他竞争对手在人工智能领域的进展时，显而易见的是，所有这些进展都极度依赖于语言技术。正是大语言模型引领了本轮对创新和投资兴趣的激增。我不禁质疑，智能的发展是否真的与语言处理能力的提升保持同步。坦率地说，我的观察并不支持这一点。我看到计算机在处理语言方面取得了显著进步，但在某些情况下，它们的智能表现却似乎有所下降。我想知道，你是否也注意到了这种智能与语言能力之间的差距。

皮查伊：确实，这个问题非常深刻。我们之所以让Gemini从一开始就拥有支持多模态的能力--虽然目前外界仅能窥见其端倪，还未全面整合进产品之中--是因为我们希望在音频、视频、文本、图像和编码等方面实现输入输出的多模态协同工作，并且我们利用这些多模态数据来训练模型。或许在下一个发展阶段，我们将能够涵盖比目前以文本为主的情况更广泛的内容。随着我们通过这种多样化的方式吸收更多信息，我们的认知和理解能力也将会得到相应的拓展。我们可以期待，未来将有更多创新和突破。

问：在去年的I/O大会中，谷歌提出了“大胆而负责任”的口号。这正是谷歌所秉持的策略。在今年的大会上，你再次强调了这一点。不过当我们看到人工智能在处理问题时出现的失误，公众的反应似乎随着时间推移而变得更加克制。举例来说，在演示中，你展示了一项多模态视频搜索功能，内容是某人试图修复一台损坏的胶片相机。但搜索结果却给出了错误的答案。视频中被突出显示的建议是：“只需打开胶片相机的后盖，然后轻轻摇晃。”这显然是一个糟糕的建议，因为这样做很可能会破坏所有的胶片。任何真正了解胶片相机工作原理有的人都不会提出这样的解决方案。

皮查伊：我与谷歌团队就此问题进行过沟通。颇具讽刺意味的是，在制作视频的过程中，他们实际上已经咨询了多位领域内的专家，并且所有这些专家都审查了答案并认为它是恰当的。我理解其中的细微差别，并赞同你的观点。显然，我们不希望在没有暗房的环境下曝光胶片。在某些特定情境下，这样的操作是行得通的。如果不想损坏相机，并且所拍摄的内容并不是特别珍贵，那么采取这种做法是合