这是我为 AI mag 撰写的德语文章的翻译。
7 月份在柏林举行的 WeAreDeveloper 世界大会上,GitHub 宣布公司将利用人工智能和助手在很短的时间内将 10 亿人变成开发者。另一方面,亚马逊云计算首席执行官在一次内部炉边谈话中解释说,很快就没有人需要再开发软件了,因为机器无论如何都可以做得更好。两种截然不同的说法,你必须问自己谁是对的,这对开发商和那些想要进入这个市场的人意味着什么。因此,让我们快速回顾一下当前的情况以及可能发生的情况。
自 1995 年以来,我本人一直是一名专业、高薪且广受欢迎的开发人员。我在雅虎、Mozilla 和微软工作了几年,并与 Google 合作开展 Chromium 项目。在我职业生涯的初期,人们不赞成我在工作时间和公司计算机上编写的软件应该免费提供给其他人,而且我所做的大部分工作仅供内部使用。
但很快开源就出现并改变了一切。起初它只是极客的工具和想法,但后来它证明了自己是一种明智的软件开发方法。云主要在 Linux 上运行,Android 在数量上优于 iOS,而且网络的很大一部分基于 WordPress。
开源和知识共享对我来说很有意义。我不想成为唯一理解和编辑该软件的人。我希望其他人能够审视我的工作,检查它,并在我不再有时间或思考让这个项目继续进行时接手。
开源让成千上万的开发人员开始了他们的职业生涯。作为首席开发人员,这意味着我不必寻找新员工,而是可以从项目内部雇用他们。我可以看到谁使用了该项目或为该项目做出了贡献。我不仅了解了这些新员工的技术能力,还了解了他们如何记录工作、处理批评以及如何在团队中沟通。
当我开始接触开源时,微软仍然是邪恶的帝国。当我在 2015 年离开 Mozilla 加入微软时,主要原因是我将帮助埋葬 Internet Explorer,这是我作为 Web 开发人员长期以来的梦想。与此同时,微软发布了 Visual Studio Code .一个开源代码编辑器将在很短的时间内彻底改变开发人员世界。
当微软将收购 GitHub 的传言开始出现时,开发者社区中充满了抱怨,许多人预测这将是该平台的终结。我有不同的看法。 GitHub 是一个很棒的平台,它简化了版本控制,并允许任何人在很短的时间内围绕其软件产品创建社区。但它是一家来自旧金山的初创公司,许多传统的欧洲公司永远不会把他们的软件或数据放在那里。如果微软是其背后的公司,那么情况就完全不同了。
我想说的是,开源早已使软件开发民主化成为可能,并允许任何人作为开发人员开始新的职业生涯。当然,网络是之前帮助实现这一目标的另一项重大发明,但现在您可以使用市场上的大公司免费使用的专业工具,并在这些工具上进行协作。
到目前为止,一切都很好。但随着人工智能的炒作,我们突然又回到了繁荣时期,让人想起千禧年初的 .com 泡沫。
人工智能的想法并不新鲜,但目前只有两个主要区别:
- 计算机的速度足以提供人工智能系统所需的动力
- ChatGPT、LLM 和 RAG 让每个人都能接触到人工智能,并且无论有意义与否,目前都在各地使用。
与看似智能的机器对话并以这种方式获取信息是任何一个伴随《星际迷航》长大的人的梦想。这也是计算机和知识的一般方法的重大变化。人们过去常常读书,然后通过门户网站和搜索引擎查找网站,但如今,他们询问机器并立即得到答案。如果答案不正确,他们可以要求更多信息。
每当用户行为发生变化时,大公司的首席执行官就会变成预测未来的算命师。当智能手机出现时,一切都必须是应用程序,因为只有这些才能为最终用户提供最好的服务。当 Siri、Cortana、Bixby、Alexa 等数字助理推出时,人们预测很快就不会再有更多的应用程序,但这些助理将能够满足我们所有的愿望。这里的模型是中国的微信,它确实是那里一切的解决方案。然而,这也是一个没有免费互联网的市场。
现在许多人预测每个软件解决方案都可以是 ChatGPT 的扩展。
每次发生这种情况时,都会立即出现一个可以提供扩展程序或应用程序的市场。这些市场很快就会变成数字垃圾堆,因为公司自动创建数百个应用程序,数字攻击者将病毒和木马作为合法产品提供,并且每个成功产品都有数百个廉价副本。
换句话说,软件正在成为一种大众产品,许多人被愚弄,相信他们明天也可以通过杀手级应用程序成为百万富翁。
然而,通常只有市场运营商才能从成功的报价中受益,而就人工智能扩展而言,最近有很多成功的想法只是在系统本身中提供的案例,而企业家突然发现所有用户都消失了。然而,这并不是什么新鲜事,因为浏览器插件和开发人员环境经常出现这种情况。
如果从外部看,它与流媒体服务类似。过去,您购买 CD 或 DVD,但今天您可以立即访问所有内容。但您也没有对内容的所有权,并且如果您想再次观看它,也不能依靠再次找到它。就像您并不总是从 ChatGPT 得到相同的答案,但有时会得到奇怪的答案。正确的东西不可用,所以这里有一些东西。
每当一项新技术想要征服市场时,你都会听到同样的说法。一是很快就可以创建出色的软件解决方案,而无需编写一行代码。在 Visual Basic 时代或后来的 WYSIWYG(“所见即所得”)环境(例如 Frontpage 或 Dreamweaver)中,情况已经如此。如今,有很多具有相同承诺的“低代码”或“无代码”解决方案,这使得创建产品变得更容易,但也提供了高度未优化的结果。
当然,这是可以预见的,这是人工智能领域的一个声明,ChatGPT 的第一个“哇”演示之一根据纸上潦草的设计创建了一个 Web 应用程序。后来,“Devin”成为第一个完全有效的人工智能软件开发人员。两者都带来了很多头条新闻和掌声,但尤其是德文,很快就发现这是一个很好的演示,但并不是真正的解决方案。
我们是否还需要开发人员取决于我们想要创建什么。 ChatGPT 的“从纸张到代码”演示应用程序是一个只需按一下按钮即可显示笑话的网站。没有人需要这个应用程序,它感觉更像是编程课程的一课。即使作为面试问题,这个应用程序也晚了 15 年来测试候选人的知识水平。
如果我们的工作是创建这样的解决方案,那么我们不需要专业的开发人员。但我们也不需要人工智能,因为低代码和无代码产品可以在多年内做到这一点。
确实,作为开发人员,您所做的许多工作都是基于现有产品的。如果它真的只是组装现有组件,那么人工智能也可以做到。
然而,还有很多问题需要更复杂的、人性化的解决方案,为此,我们需要训练有素的开发人员。在我的职业生涯中,我越来越注意到编写程序是工作中最小的部分。相反,它是关于开发人类可以理解和访问的软件,这是人工智能无法为我们完成的任务。无论伟大的新软件的广告如何承诺,可访问性和可用性都无法自动化。
对于每项工作,您都需要合适的工具。对于软件来说,那就是开发环境。它应该让我可以轻松地编写代码、查找错误、进行更改以及(如果可能的话)立即查看结果。一个好的开发环境会在我写作的时候告诉我我犯了一个错误或者如何使用一个方法。类似于文字处理程序在我打字时强调错误的方式。
如果我想了解语法、方法名称或如何解决问题,我可以查阅文档。书籍、在线文档、课程和视频。而且有很多可用的。辨别好坏几乎是一项全职工作。
这就是为什么有论坛和社交媒体可供您交流想法。
当 GitHub 提出 GitHub Copilot for VS Code 的想法时,我立即被迷住了,从第一天起我就是一名测试人员,帮助发现错误并请求新功能。
最棒的是我不必去 ChatGPT 这样的网站来询问有关编程的问题。相反,它发生在我的开发环境中,作为有关如何继续我刚刚开始的功能的建议。我还可以突出显示部分源代码并询问 AI 它的全部内容。我曾经在论坛上或在 GitHub 上以评论的形式这样做过。我一边编程一边学习,因此在更短的时间内创造了更多东西。我还可以告诉系统仅参考当前项目,而不是从互联网上给我一些结果。此外,系统还会向我学习我的期望。我使用 Copilot 的次数越多,它就越能以我本来会写的格式提供建议。它开始模仿我的风格,而不是提供随机的建议。
换句话说,研究任务是自动化的,是工作的一部分。而这就是 GitHub 相对于其他公司有明显优势的地方,这就是为什么他们有机会完成将 10 亿人变成开发者的艰巨任务。
GitHub 是我存储源代码的地方,我可以一键在浏览器中编辑代码,并且我可以接触到大量也在同一平台上进行交流的专家。所有学习步骤都在一个环境中进行。现在有更多的参与者提供这种服务,但 GitHub 的优势在于它既是一个庞大的社区,也是一个平台。
但开发的技术部分只是任务的一小部分。作为开发人员,我的大部分工作是过滤和转换数据。你永远不会得到完美的数据,好的软件是防御性编写的,测试输入,期待错误信息并过滤它。这就是人工智能在当前营销形式中真正存在的问题。
如果你向世界提出一个伟大的新解决方案,它就不会犯任何错误。这就是目前人工智能炒作的一个问题。大多数系统都会返回一些东西,而不是聊天机器人不给我答案,或者只是承认需要更多信息。在聊天以及创建图像或视频时,这些就是所谓的“幻觉”。在代码生成中,这些要么是官方文档的第一个结果,要么是大多数开发人员选择的最佳结果。这不是最好的解决方案,而是最简单的。
许多AI代码生成器都是基于Stack Overflow、Reddit等论坛、官方文档以及知名开发者个人博客的数据。问题在于,大多数时候所显示的解决方案代表的是最简单、最快的结果,而不是最安全或优化的解决方案。
几十年来,我编写了课程和书籍,每个出版商或平台都希望做到这一点:通过展示一个简单的示例,而不是立即指出所有细微差别,为参与者提供快速、积极的体验。
这些示例也被社区在论坛上评选为最佳示例,因为它们简单并且可以立即得到结果。论坛参与者不想要“为什么”,只想要“如何”。这些是人工智能聊天机器人显示为第一个结果的代码示例。即使用户告诉机器人这不是一个好的结果,底层模型也不会改变,因为这会太昂贵且耗时。
最困难的事情是找出机器人从哪里获得它提供的解决方案。人工智能领域目前并没有摊牌,而是在悄悄地蓬勃发展。当数以百万计的投资面临风险时,人们喜欢隐藏自己产品的特殊之处。它实际上开始得很好。 OpenAI 就是一个典型的例子,它最初是开放的,后来又发生了变化,以激发更多的投资。但了解模型基于哪些数据符合最终用户的利益,以便您作为原始开发人员可以解释为什么它是一个不好的示例或更新并修复已知的安全或性能问题。例如,我知道我的哪些开源 Github 存储库已被 AI 机器人读取并接管,其中一些非常成功,但这只是因为它们是一个有趣的技巧或一个非常肮脏的捷径。
目前,互联网上存在一场关于如何保护开放内容不被人工智能机器人接管的军备竞赛。许多公司已经被起诉,例如,在没有注意许可证或询问所有者的情况下提取 YouTube 内容。虽然许多开发人员以开源方式发布他们的工作,但其他人在其基础上进行构建没有问题,但当机器出现并在聊天机器人答案中使用您的代码作为没有上下文或认证的付费服务的一部分时,情况就不同了。有很多阻止列表可以保护您自己的博客或源代码存储库不被索引。然而,人工智能提供商不会识别他们的爬虫机器人,并将自己伪装成普通浏览器。毕竟,这是为了能够提供最多的数据,而不是道德或遵守许可证。
在斯坦福大学的一次演讲中,谷歌前首席执行官最近直言不讳地解释说,在创新和快速进入市场方面,窃取内容是完全可以的。企业家不用担心这个问题,交给律师吧。勇敢的新世界。
欧洲有许多规则和法律,可能被认为对一些硅谷初创公司不利,在我与美国公司的合作中,我花了很多时间向同事解释 GDPR 和类似的事情,并为无法显示用户信息而道歉,因为在他们不知情的情况下在德国录制它是违法的。很好,我们用户的隐私及其安全是最重要的。但这并不适合爆炸性增长和快速软件分发的世界。我们目前正处于一个十字路口,越来越多的人工智能系统和产品要么根本不提供,要么几个月后在欧洲提供。
政治也没有帮助。从历史上看,欧洲一直有许多开源公司和开发商,但随着欧盟开源软件资金的削减,许多提供商将不得不寻找其他方式来支付账单。这将使在寻找投资者方面难以与法律较少的其他国家的公司竞争。
总的来说,问题仍然是许多人认为开源是免费的。有句老话说,OSS“像小狗一样自由”,所以如果你得到一只免费的小狗,那就太好了,但你也必须照顾它。你必须训练动物,地毯上可能会发生事故。
其中一起事故最近震惊了 OSS 世界。几乎所有系统中的一个重要开源组件 xz 几乎被可能感染所有 Linux 机器的恶意软件所取代。问题是原来的开发人员不再有时间维护产品,而是将其交给了维护人员。这在 OSS 世界中是完全正常的行为。但事实证明,维护者计划用恶意软件替换该组件,并花时间掩盖他的意图。我们现在必须问自己,如何确保系统相关组件的维护,而不用担心将来出现类似的安全问题。如果没有财政支持,这将是困难的。
《欧洲人工智能法案》(AI Act)于8月1日生效,旨在规范人工智能世界,提高透明度,让欧洲企业在国际竞争中处于有利地位。然而,它也给开源产品带来了一个主要问题,因为这些产品是豁免的。原因之一是安全性,因为开放系统更容易受到攻击,并且可以用于恶意目的,也可以用于合法目的,而无需任何反馈或请求许可。
在IT安全领域,有一个东西一直是个谎言:通过默默无闻实现安全。仅仅因为您无法直接分析闭源系统并不意味着它们更安全。
最近,越来越多的报道称,所有封闭的人工智能系统都遭到攻击,数据丢失。许多代码生成器还通过提示注入向最终用户提供不安全代码,从而安装恶意软件。尤其是微软,它一直处于媒体的交火之中,现在甚至根据员工对公司安全的影响来发放奖金。有趣的是,几个月前,许多安全专家在 11,000 名员工的裁员浪潮中被解雇。
这些问题以及其他问题(例如 Azure Masterkey 丢失和 Crowdstrike 中断)也损害了开发人员对云和大公司的信任,几乎所有有关 AI 的讲座或文章都警告不要仅依赖一家提供商。当然,这也意味着您要么必须花费更多费用,要么依赖本地安装的系统。那么这些就必须是开源的。
GitHub 为自己设定了一项雄心勃勃的任务,并且完全有能力实现它。唯一的问题是人工智能时代的“开发者”到底是什么。讨论这个问题需要一篇单独的文章,因为这个问题有很多方面。
然而,大多数公司都隐瞒的是,人工智能商业模式目前还行不通。目前大多数公司都在支付额外费用——各种副驾驶和系统的收入不足以支付计算成本。技术成本非常高。在 GenAI 革命之前,几乎所有大公司都宣称他们很快将实现“碳中和”或仅依赖绿色能源,但这种情况已经有一段时间了,而且所有人都对这个话题保持沉默。目前,生成式人工智能是一种疯狂的能源浪费——创建每张图像所需的电量相当于给手机充电的电量。
因此,AI-on-device的想法将会变得越来越有趣。所有开源人工智能模型都可以在本地使用,而不是在云中托管模型,例如,谷歌已经在尝试将 Gemini 集成到 Chrome 中。还有一些开源项目提供不依赖云的人工智能聊天系统。
然而,总的来说,这是非常有趣的时期,市场总是需要更多的开发人员。我不认为开发人员可以被取代,而且我确实认为智能且易于访问的开发环境给了很多新人参与的机会。
问题是,我如何将这些新手变成可以为自己的工作感到自豪的开发人员,以及在人工智能说“接受这个,一切都会成功”之后,我们可以做些什么来让接下来的学习步骤对他们有吸引力。
- GitHub 的 Thomas Dohmke 和 Demetris Cheatham 在 WeAreDevelopers 世界大会上发表主题演讲:十亿开发者之路
- 亚马逊云首席执行官预测,未来大多数软件工程师将不再编码,而是由人工智能来编码
- 在一份泄露的录音中,亚马逊云负责人告诉员工,一旦人工智能接管,大多数开发人员可能会停止编码
- 视觉工作室代码
- 微软押注聊天机器人作为与设备和应用程序交互的新方式
- 第一个 GPT-4 演示根据提示构建应用程序
- 德文,人工智能工程师
- 德文是假的吗?
- VS Code 的 GitHub Copilot
- Gemini AI平台被指未经用户许可扫描Google Drive文件
- Nvidia 在 404 媒体调查后因抓取 YouTube 内容而被起诉
- 人工智能初创公司 Anthropic 因过度网络抓取而遭到强烈反对
- 谷歌前首席执行官埃里克·施密特表示,成功的人工智能初创公司可以窃取知识产权并聘请律师来“收拾残局”
- 埃里克·施密特成绩单
- 要阻止的 AI 网络爬虫列表
- 自由和开源软件资金从欧盟 2025 年地平线计划中消失
- 欧盟必须继续资助自由软件
- 开源人士表示,疑似 xz 式攻击继续针对维护者
- 评估 XZ Utils 事件的 Y 和方式
- 我们需要从 XZ 后门中得到什么
- 我是如何在 ZeroMQ 中发现一个 9.8 严重安全漏洞的,主要是纯粹的运气和我对 xz 后门的两分钱
- xz 开源攻击的时间表
- 我所知道的关于 XZ 后门的一切
- XZ 后门 CVE-2024–3094
- Xz 后门凸显了开源软件的漏洞及其优势
- 深入探讨 XZ Utils 后门 — 哥伦比亚工程学院高级系统编程客座讲座
- 欧盟人工智能法案:首个人工智能法规
- Slack AI 可能会被诱骗通过即时注入从私人渠道泄露数据
- 通过间接提示注入从 Slack AI 中窃取数据
- GitHub 评论被滥用,通过 Microsoft 存储库 URL 推送恶意软件
- 微软将员工奖金和晋升与安全绩效挂钩
- Microsoft 的 gestohlener Schlüssel mächtiger als vermutet
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除