奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: 苹果计划在 Siri、Xcode 等产品中整合 AI

Wilson(42865)

发表于2023年10月23日 14时09分星期一
来自苏珊娜之歌

苹果计划在 Siri、Xcode 等产品中整合 AI。苹果已建立了自己的大模型 Ajax，在此基础上还创建了一个聊天机器人服务，部分工程师称之为“苹果GPT”。下一步的关键是确定该技术是否能应对竞争对手，以及苹果如何将其实际应用到产品中。负责 AI 的高级副总裁 John Giannandrea 的团队正在改进 Siri。这个更智能的 Siri 版本最早可能会在明年准备就绪，但这项技术仍然让人感到担忧，而且苹果的 AI 功能可能需要更长的时间才能在产品线中普及。苹果软件工程团队也在考虑将生成式 AI 集成到 Xcode 等开发工具中，这可以帮助开发人员更快地编写新应用，使其与微软的 GitHub Copilot 等服务保持一致。苹果公司内部正在争论如何部署生成式 AI：完全在设备上运行、基于云运行或介于两者之间。部署在设备上会运行得更快，并有助于保护隐私，但通过云部署大模型将允许更高级的操作。

科技: 受脑启发的低功耗 AI 推理芯片 NorthPole

Wilson(42865)

发表于2023年10月20日 17时58分星期五
来自人性分解

IBM 的研究人员在《科学》期刊上发表论文，提出了受脑启发的芯片架构 NorthPole，它能将计算与记忆相结合，并以低能耗高效地处理数据。自计算机诞生以来，计算过程一直以处理器为中心，记忆内存与计算是分离的。然而在记忆内存和计算之间穿梭传输大量数据会在能耗、处理带宽和速度方面付出高昂的代价。这在新兴的和先进的实时 AI 应用（如脸部识别、物体检测和行为监控等）中尤其明显，这些应用需要快速获取海量数据。因此，大多数现代计算机架构正在迅速达到物理和处理瓶颈，而且鉴于所涉及的能源成本不断增长，其在经济、技术和环境上都面临着无法持续的风险。NorthPole 是一种将计算与记忆内存交织于单个芯片上的神经推理架构，对 ResNet50 的测试显示，它能将每瓦每秒帧数 (FPS) 的能量指标提高 25 倍，每个晶体管的 FPS 的空间指标提高 5 倍，相对于同类技术延迟的时间指标降低 22 倍。

科技: Microsoft AI 为古腾堡项目录制了 5000 本有声书

Wilson(42865)

发表于2023年10月20日 15时15分星期五
来自梦境救援

微软、Google、MIT 的研究人员与古腾堡项目合作制作了 5000 本开放授权的有声读物，音频总时长 3.5 万小时，包含了虚构和非虚构类作品，每个人都能找到适合自己的内容。研究人员的论文《Large-Scale Automatic Audiobook Creation》发表在预印本平台 arXiv.org，他们指出，对于视障人士、年轻儿童，甚至语言新手来说，有声读物能“显著提高文学作品的易读性”。这批有声读物 The Project Gutenberg Open Audiobook Collection 可以通过各大平台的播客应用获取。

科技: 科技领袖称 AI 将改变拥有一份工作的意义

Wilson(42865)

发表于2023年10月18日 23时24分星期三
来自血族3：永夜

科技领袖周二表示，AI 将对劳动力带来巨大变革，将会消除许多职业，要求社会重新思考人们如何度过时间。从医生到作家的各类专业人士已经在担心 A I会完全取代某些岗位。但 Adobe 的数字媒体业务总裁 David Wadhwani 称，尽管存在相关担忧，但他认为 AI 是一种能促进就业而不是让人失业的工具。他表示，Adobe 的Firefly等工具可以生成图像和标识，让更多人成为创意专业人士。风险资本家 Vinod Khosla 称，目前对 AI 的大多数风投都将赔钱。AI 投资已进入炒作阶段，只有高度自律的投资者才能通过押注这项变革性技术而获利。Khosla 还警告说不要将先进AI模型背后的代码公之于众。一些技术专家主张公开代码可以促进这项技术的发展。他说：“你不会将曼哈顿计划开源。”

科技: 百度公布文心大模型4.0，称能与 ChatGPT-4 媲美

Wilson(42865)

发表于2023年10月17日 21时32分星期二
来自奇迹之夏

李彦宏在百度世界 2023 大会上宣布了最新版本的文心大模型4.0，称综合能力“与GPT-4相比毫不逊色”。文心大模型4.0 目前处于邀请测试阶段。李彦宏演示了最新大模型的四大能力的特点与应用场景。在理解能力上，他通过询问公积金异地贷款政策的案例，展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力，例如“在北京工作”等同于“在北京缴纳公积金”等，“今天，你说的每一句话，它大概率都能听懂”。在生成能力上，李彦宏展示了文心一言如何在短短几分钟内，根据一张素材图片，迅速生成了一组广告海报、五条广告文案，以及一条营销视频。他还通过解数学题、总结知识点等场景，展示了大模型的逻辑能力；通过数千字的小说撰写和角色、情节设置，体现了大模型的记忆能力；以及数字人医生帮助患者解读药品说明书，来展现四大能力的综合应用。百度表示将基于最新模型更新搜索引擎、地图等应用。和其它提供大模型的国内企业类似，使用大模型都基于实名制。

科技: 科学家利用 ChatGPT 背后的技术构建用于科学发现的 AI

Wilson(42865)

发表于2023年10月16日 18时03分星期一
来自消失吧！书本

一个国际科学家团队正利用 ChatGPT 背后的技术构建用于科学发现的 AI 工具。该项目被称为 Polymathic AI，研究人员已经在 arXiv 上发表了一系列论文预印本。ChatGPT 是利用从互联网上搜集的文本数据集进行训练，而 Polymathic AI 将从不同科学领域的数值数据和物理模拟进行训练，帮助科学家对从超巨星到地球气候的各种现象进行建模。从已有的预训练大模型开始，而不是从头构建科学模型，要更快更准确。研究人员表示，Polymathic AI 有望展示不同领域之间可能被忽视的共性和联系。

科技: AI 耗电量将与国家相当

Wilson(42865)

发表于2023年10月15日 22时30分星期日
来自幻想曲

训练 AI 和运行 AI 都是能量密集过程。AI 公司 Hugging Face 报告称，其多语言文本生成 AI 工具在训练期间消耗了约 433 MWH 的电力，足以为 40 个普通美国家庭供电一年。荷兰阿姆斯特丹自由大学的 Alex de Vries 指出，每当 AI 工具生成文本或图像时，它也会使用大量的计算能力和能源。例如 ChatGPT 每天运行可能需要 564 MWH 的电力。虽然，世界各地的公司都在努力提高 AI 硬件和软件的效率，以降低这种工具消耗的能源，但机器效率的提高往往会增加需求。最终，技术进步将导致资源使用的净增加，这种现象被称为杰文斯悖论。De Vries 说：“提高这些工具的效率和易用性的结果可能是，我们允许更多的应用程序和更多的人使用它。”研究人员估计，如果每一次 Google 搜索都使用 AI，每年将需要大约 29.2 TWH 的电力，这相当于爱尔兰一年的用电量。到 2027年全球 AI 相关的用电量预计每年将增加 85~134 TWH。这相当于荷兰、阿根廷、瑞典等国家的年用电量。

科技: Herculaneum 纸草卷轴首个文字在 AI 帮助下成功识别

Wilson(42865)

发表于2023年10月14日 23时48分星期六
来自其主之声

Herculaneum 纸草卷轴是庞贝附近一座私人别墅图书馆的藏品，因公元 79 年维苏威火山喷发而被掩埋，在高温下碳化。1752 年它们被挖掘出来。它们非常脆弱，处理不当就会变成灰烬。如何阅读无法打开的卷轴？这个问题持续了数百年。2019 年肯塔基大学 EduceLab 的 Brent Seales 教授使用粒子加速器对 Herculaneum 卷轴进行了成像，生成了分辨率达 4 µm 的 3D CT 扫描。他的团队还扫描拍摄了有可见墨水的卷轴碎片。企业家 Nat Friedman 和 Daniel Gross 对该项目产生了兴趣，他们在 2023 年 3 月发起挑战赛 Vesuvius Challenge，奖励能识别卷轴文字的人。8 月参赛者 Casey Handmer 报告在 CT 扫描中发现了看起来像是墨水的“裂纹图案”。SpaceX 暑期实习生 Luke Farritor 开始对裂纹图案训练一个机器学习模型，每一个新裂纹的发现都帮助改进了模型。模型很快揭露了人眼看不见的裂纹痕迹，他发现了卷轴的第一个文字——ΠΟΡΦΥΡΑϹ ——意思是紫色的。他赢得了 4 万美元的 First Letters Prize 奖。另一名参赛者 Youssef Nader 也在同一区域发现了相同文字，她作为第二名赢得了 1 万美元。Casey Handmer 作为墨水痕迹的首位发现者获得了 1 万美元的 First Ink Prize。

科技: 微软为绘图应用加入基于 DALL-E 的文本图像生成功能

Wilson(42865)

发表于2023年10月13日 16时19分星期五
来自凡尔纳地球三部曲

微软本周向 Windows Insiders 测试者推送了新版的绘图应用（Paint app），其中包括了 Paint Cocreator，基于 DALL-E 的 AI 文本图像生成功能，用户可通过简短文字去描述想要生成的内容，选择不同的艺术风格，然后点击 Create。Paint Cocreator 将生成一组图像供用户选择。微软称 AI 图像生成功能内置有内容过滤器，防止生成有害的、冒犯性的或不合适的图像。

科技: Google 内部质疑大语言模型的可用性

Wilson(42865)

发表于2023年10月12日 20时11分星期四
来自泰山和蚁人

Google 通过 Discord 邀请了部分 AI 聊天机器人 Bard 的重度使用用户，一起聊天讨论了 AI 工具的有效性和实用性，Google 的产品经理在讨论期间质疑了大模型的可用性。Bard 高级产品经理 Dominik Rabiej 在 7 月的 Discord 聊天中表示，他的经验法则是，除非能独立验证不要相信大模型的输出结果。负责 Bard 用户体验的 Cathy Pearl 说，他认为最大的挑战是，就有用性而言，大模型最擅长什么。Rabiej 则建议将 Bard 作为“创意/头脑风暴应用”使用，也可以将 Bard 用于辅助编程，因为编程的话用户肯定需要检查代码是否有效。

科技: Adobe 演示 AI 上采样技术，将低分辨率动图和视频放大到高分辨率

Wilson(42865)

发表于2023年10月12日 17时36分星期四
来自繁星若尘

Adobe 演示了其开发的实验性 AI 上采样技术，能将低分辨率 GIF 动图和视频片段放大到高分辨率。该项目被称为 Project Res-Up，Adobe 尚未提供开放测试，它使用了基于 diffusion 的上采样技术提升视频分辨率，同时改进清晰度和细节。在演示中，Adobe 从《The Red House(1947)》提取了一段 480 x 360 分辨率的片段，使用上采样放大到 1280 x 960，总像素增加 675%。生成的视频更清晰，AI 移除了绝大部分的模糊，甚至添加了发丝和高亮等新细节。

科技: ChatGPT 等 AI 工具如何改变科学出版

Wilson(42865)

发表于2023年10月11日 21时29分星期三
来自图书馆员与黄金锅

当西雅图华盛顿大学医学院的 Domenico Mastrodicasa 医生在写论文遇到困难时他会求助于 ChatGPT，聊天机器人会在几秒钟内响应查询。他是众多使用生成式 AI 帮助撰写论文的研究人员之一。他购买了付费版本 ChatGPT Plus，每周使用数次，认为它对帮助他理清思路非常有用。很多人预测生成式 AI 将成为撰写论文手稿、同行审议报告和拨款申请的常规助手，认为非母语为英语的研究人员将会受益最多。部分研究人员认为这意味着他们可以将时间更多的投入在研究而不是论文撰写上。加州伯克利的 Michael Eisen 说，写论文从来不是真正的目的，搞科学才是。但生成式 AI 难以避免的不精确性和捏造的内容将是科学出版面临的一大难题。出版商担心这可能会意味着出现更多错误百出的手稿。

科技: 微软据报 GitHub Copilot 业务亏损

Wilson(42865)

发表于2023年10月10日 15时29分星期二
来自苹果树下的宇宙飞船

生成式 AI 热潮给很多公司带来了巨额利润，其中受益最大的可能是 GPU 芯片供不应求的英伟达了。而微软据报道难以受益于其 AI 业务。它为程序员提供的 AI 编程助手 GitHub Copilot 就一直亏损。GitHub Copilot 于 2022 年 6 月推出，月费 10 美元或年费 100 美元。身份验证过的学生和知名开源项目开发者可免费使用。据知情人士透露，微软今年初每月每位用户平均损失逾 20 美元，部分用户损失最高逾 80 美元。微软一直尝试降低 AI 服务费用，其中之一是自研而不是依赖英伟达供应 AI 芯片。软件巨人最早可能会在下个月的 Ignite 大会上宣布其 AI 芯片。

科技: 微型语言模型的时代来临

Wilson(42865)

发表于2023年10月08日 23时16分星期日
来自金刚

学习英语对人类而言并非易事，但计算机学习英语的方法十分简单：将互联网上收集的海量文本输入到名叫神经网络的数学模型中。这是 OpenAI ChatGPT 等生成式 AI 模型背后的工作原理。但这种方法的缺点也十分明显：训练成本昂贵且耗费大量时间。大语言模型的黑箱也让人难以理解其内部工作以及为什么会失败。面对困难，部分研究人员选择了在小型数据集上训练小型模型，然后研究其行为。微软研究人员最近在预印本平台 arxiv.org 上发表论文，介绍了一种训练微型语言模型的新方法：用儿童故事培养它们。 ChatGPT 使用的 GPT-3.5 模型有近 2000 亿个参数，需要至少 1000 个 GPU 训练数周时间。只有少数公司能获得必要的资源。但微软研究人员的研究表明，规模仅为最先进大语言模型数千分之一的微型语言模型在这种方法训练下能很快学会讲述一致且语法正确的故事。这项研究结果或能为新研究指明方向。

科技: 佛罗里达男子持武器击落警方无人机面临 10 年徒刑

Wilson(42865)

发表于2023年10月08日 20时18分星期日
来自红脖

52 岁的佛罗里达男子 Wendell Doyle Goney 本周认罪，他作为一名已定罪重罪犯而持有武器，并使用武器击落了警方无人机，他面临 10 年徒刑，其判决将在明年 1 月 18 日宣布。警方是在 2021 年 7 月出警回应一起入室盗窃案，当使用价值 2.9 万美元的无人机进行户外搜索时，无人机被 Goney 从附近住宅区使用步枪开枪击落。Goney 声称无人机令其不甚烦恼。记录显示，Goney 犯有 29 项重罪，包括恶意伤害警官、暴力拒捕、非法持有毒品、入室盗窃，以及已定罪重罪犯而持有武器。美国联邦法律禁止大多数已定罪重罪犯持有武器。

科技: 日本 AI 草案提出使用方需承担部分责任

Wilson(42865)

发表于2023年10月08日 14时52分星期日
来自勇者物语

为了妥善利用生成文本和图像的生成式 AI，日本政府正推进制定面向企业等的指导方针。草案显示不仅是 AI开发商和服务提供商，使用 AI 开展业务的企业和团体也将承担一定的责任。指导方针明确了创造 AI 基础性技术的“算法开发者”、提供基于 AI 的服务和软件的“服务实施者”以及运用 AI 开展业务的企业等五大业务主体须共同担负责任和义务。草案指出，社会所追求的方向是“开发和使用 AI 是为了拓展人们的能力，使追求幸福成为可能”，“不得以企图侵犯人权、实施恐怖主义及犯罪为目的、或助长上述行为的不当输入输出方式提供或使用 AI”。

科技: AMD 如何跨过英伟达的 CUDA 护城河

Wilson(42865)

发表于2023年10月08日 11时31分星期日
来自歌剧院魅影

生成式 AI 使用的 GPU 基本上指的都是英伟达的产品。英伟达被广泛视为是一家硬件公司，但它的软件工程师数量多于硬件工程师。它对使用其软件工具（CUDA）设定了非常低的门槛，围绕其硬件构建了强大的软件护城河。完全依赖于英伟达的产品对生成式 AI 领域的众多科技公司而言并非好事，其中一大问题是英伟达的产品供不应求。部分大公司拥抱了自研 AI 芯片，而 AMD 和英特尔等也都努力进入这一市场。因为 CUDA 工具的广泛使用，即使不使用英伟达的硬件，其它公司的 GPU 和加速器仍然需要设法支持 CUDA。PyTorch 已经将用户与底层 GPU 架构分离开来，而 AMD ROCm 提供了 CUDA 的开源替代，今天跨越 CUDA 护城河可能就像使用 PyTorch 一样简单。

科技: OpenAI 探索制造自己的 AI 芯片

Wilson(42865)

发表于2023年10月07日 18时38分星期六
来自侦图机

路透援引知情人士的消息报道，OpenAI 正探索自己制造 AI 芯片，评估潜在收购目标。该公司尚未决定是否推进该计划。目前 AI 芯片主要依赖于英伟达的芯片，该公司控制着逾八成的市场份额。OpenAI 想要 AI 芯片供应的多元化。OpenAI 的聊天机器人 ChatGPT 运行成本昂贵，分析师估计每次查询的成本为 4 美分。如果 ChatGPT 的查询份额达到 Google 的十分之一，那么 OpenAI 早期阶段需要价值 481 亿美元的 GPU，后续运行每年还需要 160 亿美元的芯片。

科技: 研究显示大模型在无损压缩上能超过 PNG 和 FLAC

Wilson(42865)

发表于2023年10月01日 21时58分星期日
来自来自12个星球的敌人

Google DeepMind 和 Meta 的研究人员在预印本平台 arXiv 上发表论文《Language Modeling Is Compression》，他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。Chinchilla 70B 能将 ImageNet 图像数据库无损压缩到原始大小 43.4%，超过了 PNG 算法的 58.5%。Chinchilla 能将 LibriSpeech 音频数据集中的样本无损压缩到原始大小 16.4%，超过 FLAC 算法的 30.3%。Chinchilla 70B 主要是训练去处理文本，但它在压缩其它类型的数据集上的效果也表现优异，甚至优于专门的算法。

科技: Signal 总裁认为 AI 本质上是一种监控技术

Wilson(42865)

发表于2023年09月27日 17时54分星期三
来自消失吧！书本

AI 模型需要大数据集训练，那数据集来自何处呢？网民。AI 要快速变现，最方便的途径是什么呢？显然是监控。Signal 总裁 Meredith Whittaker 对此评论道，AI 本质上是一种监控技术。这是依赖于货币化用户数据的企业对 AI 十分热衷的一个原因。AI 有助于巩固和扩展监控商业模式。她说，当你走过一个面部识别摄像头，它配备了伪科学的情绪识别功能，它会生成你的数据，不管对错，会说你“快乐、悲伤、脾气不好或骗子”诸如此类。这些终极监控系统正在推销给有权力监控的人，如雇主和政府，其决策和预测将影响我们对资源和机会的获取。