ChatGPT:我开始慌了!
两天前,谷歌类 ChatGPT 产品 Bard 迎来了大规模的更新,加入了很多呼声很高的新功能,比如识图能力,号称「史上最大升级」!
通过识图能力,Bard 可以解释放入聊天中的图片,也可以识别关于图像内容的更多信息以及基于图像生成标题等。可以说,Bard 通过其多模态升级改变了 ChatGPT 的游戏规则。
这个周末,对 Bard 心痒的开发者们已经迫不及待地使用谷歌 Bard 来创建各种有趣的应用了。
不禁好奇:开发者们究竟能利用 Bard 干什么呢?推特博主 @minchoi 汇总了多个令人惊艳的 Bard 用例。此外机器之心还整理了其他一些有趣用例。让我们一睹为快吧。
一张草图变成笑话网站
谷歌 Bard 的更新太疯狂了。有人利用餐巾纸上的草图创建了一个网站,并且只需要一个提示。
详细步骤如下所示。
首先,访问 Bard 网站,单击「+」来添加草图图像并编写提示。这里的提示是「编写一个简短的 HTML/JS,将它变成一个丰富多彩的网站,其中用两个真实的笑话来替换原有内容」。
这时你可能无法得到想要的结果。通过点击「查看其他草稿」,Bard 会提供另外两个选项,或者重新生成输出。如果想要更改特定内容,只需要在第二个提示中提出要求即可。这里要求更改颜色。
接下来为了实现运行,将 HTML 代码复制到文本编辑器(或文本文件)中并命名为 [something].html。这样你就完成了最终的网站和笑话的妙语。
一个屏幕截图就能创建 iPhone 应用程序
如果你觉得不够震撼,那再来点硬核的。使用谷歌 Bard,有人仅通过一张屏幕截图就重新创建了一个基本的计时器应用程序,用时不到 4 分钟。
此外不需要给 Bard 任何关于该应用程序要做什么的提示,它就提供了所有代码。虽然也出现了一些错误,但 Bard 都能及时修复。
下面视频中介绍了完整的创建过程。
对于 Bard 的这个妙用,有网友表示,在 GPT-4 发布的时候见到过这样的 Demo,比如绘制网站的 UI 并进行 AI 编码。此次 Bard 为想要创建应用或网站,但不想解释整个 UI(只想绘制草图或在 Figma 中创建)的非技术人员提供了很多有趣的想法。
类似的例子还有很多,比如还有人将图像转换为代码,运行速度很快。
更精更专的个人助理
个人助手是对话大模型的一大用例,谷歌 Bard 做到了更精更专。
该博主 @minchoi 将 Bard 调教成了自己的费用管理助手。详细步骤如下:
第一步:使用以下提示「我希望你作为我的私人助理来安排旅行费用。我会为你提供一系列图像,希望你将它们放在一个表格中,包含费用报告的所有相关信息(日期、时间、类别、说明、含税总金额)。当我没有更多收据时,会告诉你「我完成了」。表格标题为『费用报告』」。
第二步:向 Bard 提供收据。在手机上,拍摄收据照片并告诉 Bard 收据 < 编号 >,即收据 1、收据 2。请确保照片清晰,以便 Bard 可以准确地提取信息。虽然 Bard 可以相当准确地提取文本,但请务必验证信息是否正确。
第三步:当添加完所有收据后,请输入「我完成了」。Bard 会将所有信息编译成一个表格。
第四步:告诉 Bard 生成导出报告。此外还可以将数据导出到 Google 表格,并准备好费用报告。
从图片中获取完整食谱
对话大模型给出一顿饭的食谱并不是什么新鲜的功能,但 Bard 这次显然不一样。
有人上传了一张自己最近吃过的一顿饭的图片,要求 Bard 提供完整的食谱。
结果令人大吃一惊,Bard 给出了非常准确的食谱以及步骤。这意味着 Bard 的多模态功能更进了一步,似乎用到了逻辑推理能力。
更多其他用例
解释代码
Bard 现在可以逐行地解释用户的代码,帮助完成编程和软件开发任务,包括代码生成、代码调试和解释。
OCR 文字识别
Bard 现在可以从发票中提取文本,并将信息汇总到漂亮的表格中。
诊断脑 CT 图像
Bard 从一张 CT 图像中给出了自己的诊断结果,可能是脑肿瘤、中风、脑出血或其他任何疾病。
随着开发者体验的不断增加,相信未来谷歌 Bard 会有更多有趣、硬核的用例被发掘出来。
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。