新的框架“DocGraphLM”增强文档理解

New Framework ‘DocGraphLM’ Enhances Document Understanding

美国摩根大通AI研究与达特茅斯学院的研究人员共同开发了一种名为“DocGraphLM”的创新框架,该框架显著改进了对视觉丰富文档的理解能力。准确处理和解读来自各种文档格式的数据,特别是商业表格、收据和发票等视觉丰富的文档,一直是一个紧迫的问题。

传统方法依靠基于Transformer的模型和图神经网络(GNN)进行文档解释。然而,这些方法往往难以捕捉表格单元及其标题之间或跨行换行的空间关系。

DocGraphLM通过将语言模型的优势与GNN提供的结构洞察力相结合,提供了一种新的方法。这种独特的集成方法可以更好地表示文档,从而实现对视觉丰富文档中复杂关系和结构的准确建模。

在核心部分,DocGraphLM引入了一种用于文档表示的联合编码器架构,以及一种创新的链接预测方法,用于重构文档图。模型的突出特点是它能够预测文档图中节点之间的方向和距离。通过对距离进行对数转换进行标准化,模型有效地捕捉到视觉丰富文档的复杂布局。

在性能方面,DocGraphLM在标准数据集上在信息提取和问答任务中表现优于现有模型。图形特征的整合提高了模型的准确性,并加速了训练过程中的学习,从而实现了更快速、更准确的信息提取。

DocGraphLM的开发代表着文档理解领域的一大飞跃。其创新框架提供了从视觉丰富文档中提取信息的增强准确性和效率。这一进步为在当今数字时代提供了高效的数据提取和分析的新可能性。… Read the rest

OpenAI推出GPT Store:为定制AI应用带来变革

OpenAI Launches GPT Store: A Game-Changer for Custom AI Applications

开智人工智能公司OpenAI近日推出了其最新项目,GPT Store,这是一个在线平台,让开发者可以销售和分发他们自己定制的AI软件。此举预计将彻底改变AI产业,专家们将其与苹果和谷歌的应用商店对移动应用的影响相提并论。

GPT Store提供个性化的人工智能应用,使用户能够发现和构建特定主题或需求的版本。想象一下,有一个完全致力于提供晚餐食谱或解决数学问题的AI机器人,或者一个专门设计用于生成幽默“妈妈笑话”的AI程序。这一发展被誉为具有突破性意义,因为它通过实现与AI工具的自然语言交互,将开发者和用户两个市场的优势结合在一起。

多伦多大学创新破坏实验室(University of Toronto’s Creative Destruction Lab)的执行主任Sonia Sennik将GPT Store描述为“一个可获得性的途径”,并强调它能够使非编程人员在数字生产中发挥作用,而无需软件工程师的帮助。在一个大规模市场上,定制AI聊天机器人具有广泛的可获得性,专家们预计将会产生“雪球效应”,吸引用户和开发者加入这个新平台。

然而,由于潜在错误的责任和监管不明确,针对大众市场人工智能的道德和法律问题引发了关注。例如,如果一个AI应用为用户错误地预订旅行安排,谁将负责?多伦多大学的法学教授Gillian Hadfield对当这样的代理人公开运行并产生不同结果时,对我们的市场经济造成的影响表示质疑。

尽管存在这些顾虑,GPT Store已经取得了良好的反响,拥有众多用户,例如温哥华的技术公司Commit。他们开发了一个定制的AI应用,可以自动帮助技术人员寻找、研究和申请工作。Commit的联合创始人Greg Gunn赞赏该商店的收益共享功能,这消除了开发者自行处理金融交易的需要。

最初计划在11月发布,由于来自客户的反馈,GPT Store经历了一些延迟。现在,它已经向付费ChatGPT计划的用户推出,并计划在未来几个月内增加GPT创作者的货币化选项。通过这一创新举措,OpenAI无疑将自己定位为定制AI应用领域的革命者。… Read the rest

提升交通监控和安全的人工智能整合

Integration of Artificial Intelligence to Improve Traffic Monitoring and Safety

为了加强交通监控和减少违规行为,副首席部长DK Shivakumar宣布将人工智能(AI)融入交通管理,以监督与交通相关的违规行为。这种创新方法旨在为道路创造更安全的环境,并确保交通规则得到严格执行。

Shivakumar强调了解决涉及两轮车的事故数量不断增加的重要性,表示在过去三年里已经取消了超过6000个驾驶执照。他强调对于两轮车骑手来说佩戴头盔至关重要,并敦促公众优先考虑生命并遵守交通规则。

为了解决城市人口增长和车辆数量增加导致的交通拥堵问题,Shivakumar透露正在制定一项综合策略。这项策略将从其他国家引入有效的交通管理模型,以减轻拥堵并促进交通流畅。

关于驱逐街头摊贩的问题,Shivakumar澄清了这一行动是符合高等法院的命令。他强调人行道是为行人准备的,街头摊贩应该在指定地点开展业务。政府也愿意提供经济援助来支持街头摊贩的搬迁。

将人工智能整合到交通监控中是改善道路安全的有希望的一步。通过利用先进技术,当局可以有效监测交通违规行为,并采取适当措施加以遏制。此外,综合的交通管理策略还包括其他国家的交通管理模型,展示了政府致力于为城市不断增加的交通挑战寻找创新解决方案的决心。

总而言之,人工智能的整合和综合的交通管理策略反映出政府优先考虑安全,并减少城市交通违规行为的决心。通过这些举措,班加罗尔旨在为居民创造更安全、更高效的交通系统。… Read the rest

Apple Vision Pro:强大的M2芯片和灵活的付款选择揭示

Apple Vision Pro: Powerful M2 Chip and Flexible Payment Options Revealed

根据最新的传言,即将推出的Apple Vision Pro混合现实头盔将配备更高端版本的M2芯片,提供了更强大的图形性能。预计这款售价为3499美元的设备将采用M2芯片的10核GPU变体,实现图形性能的小幅可见提升。这项改进将确保在Vision Pro的两个4K微LED屏幕上享受内容时的无缝体验。M2芯片还将配备8核CPU,使头盔能够高效处理更复杂的任务。

苹果决定提供Apple Card分期付款作为一种付款选择是明智之举,这将使更广泛的用户能够更轻松地购买Vision Pro。有了分期付款的能力,用户现在可以在购买这款高端产品时避免高额的预付款。这种灵活的付款选择可能会吸引更多的消费者,并鼓励他们将Vision Pro作为日常使用的设备。

Apple Vision Pro的预购将于1月19日开始,正式发布日期预定为2月2日。苹果的粉丝和虚拟现实爱好者都迫切期待着这款创新的混合现实头盔的发布。凭借强大的M2芯片和价格实惠的付款计划选择,Vision Pro旨在为更多消费者提供卓越的虚拟现实体验。

随着苹果继续突破技术界限,Vision Pro是该公司致力于提供领先设备和沉浸式体验的又一个重要步骤。无论是用于游戏、虚拟会议还是探索虚拟世界,Vision Pro都将成为苹果创新产品阵容中令人兴奋的成员。… Read the rest

邮局丑闻影响富士通股价

Post Office Scandal Shakes Fujitsu’s Share Price

总结:英国富士通是一家重要的高科技公司,正面临一场被称为“Horizon丑闻”的丑闻,该丑闻涉及其为英国邮局提供的计算机系统。此丑闻已经造成了重大的财务和个人损害,引发了对富士通赔偿以及未来合同损失的讨论。因此,富士通的股价已经从去年12月创下的历史高点下跌。赔偿金额和对未来合同的影响仍然不确定。

半导体行业的正面和负面趋势

半导体行业在各个领域经历了正面和负面趋势。从收入来看,Nanya报告了31.73%的年增长率,而UMC经历了18.9%的年降幅。三星的销售额持平,但季度运营利润增长了16%。此外,德国成立了一个名为Quintaurius的合作伙伴关系,其中包括博世、英飞凌、Nordic、NXP和高通等科技公司。另一方面,英特尔获得了一款新的ASML High-NA EUV工具,这已经引起了图片机会的兴奋。

台积电2024年的收入和增长展望

台积电是一家领先的半导体公司,报告了2023年第四季度的收入为NT$625,529,相当于195.5亿美元,环比增长13%,同比减少2%。然而,其2023年全年收入为NT$2,161.74亿,同比下降4.5%。尽管预计2024年第一季度收入将下降5-10%,但台积电预计全年收入将同比增长5-10%。投资者将密切关注台积电于1月18日发布的即将到来的业绩公告。

Mobileye面临令人失望的业绩和库存问题

Mobileye是一家专注于自动驾驶解决方案的科技公司,其对业绩进行了显著的下调,令市场感到惊讶。该公司的股价因下调幅度过大而反应疲软。Mobileye指出,过剩库存是一个主要问题,表明他们的客户积累了过多的库存。

台湾PC行业表现和CES活动

台湾PC行业最近出现了下降,其中宏碁和南亚科技是最大的输家。然而,戴尔作为一家表现出色的领军者。正在进行的CES活动为公司展示最新产品和创新提供了机会。作为该行业的关键参与者,台积电的业绩将在本月晚些时候公布,这将受到投资者的密切关注。

量子技术的进展和与Quanmatic的合作

量子技术的使用预计将显著提高半导体行业的电子分选(EDS)性能。通过与Quanmatic的合作,预计全面实施将于4月开始,从而推动由功率半导体和增加效率驱动的长期增长。这可能导致参与该领域的公司利润的扩大。

鸿海的营收下降和购买机会

鸿海是一家科技公司,12月份的营收数据低于平常水平。然而,该公司的MIH EV联盟在2024年的CES上展示解决方案,并预计将在台湾交付大量客户的“n7”电动汽车。尽管营收下降,鸿海的股价交易价格具有吸引力,这为投资者提供了购买机会。

复苏的半导体周期和Ferrotec的投资机会

半导体公司Ferrotec的股价有所下跌,但显示出复苏的潜力。随着销售和经营在财年下半年有望改善,特别是在功率半导体基板方面,Ferrotec提供了一个投资机会。该公司正在扩大其在日本、中国和马来西亚的产能,并未报道由能登半岛地震造成的重大损害。… Read the rest

人工智能与全球关于民主的担忧

Artificial Intelligence and the Global Concerns Surrounding Democracy

人工智能(AI)在全球政治格局中引发了重大关切,因其有潜力破坏民主的核心。在许多国家举行选举的这一年,这个问题变得更加突出。美国,常被视为民主的捍卫者,在AI所带来的威胁面前也不例外。

最近,美国共和党议员罗恩·德桑提斯因发布一则广告,在其中使用了一张虚假的照片,将前总统唐纳德·特朗普和安东尼·福奇博士放在一起,受到了审查。这个例子突显了AI技术可以被用来操纵和欺骗选民,强调了对其在政治竞选中使用的规范之重要性。

即将到来的爱荷华州共和党党团会议标志着世界各地选举开始的一年。然而,对民主的消退的担忧仍在存在,为这些选举过程蒙上了阴影。这个问题在美国尤为突出,其中民主制度的完整性正在受到考验。

全球分析师和专家已经警告过AI驱动的宣传活动的危险,这些活动可以传播虚假信息和操纵公众意见。在媒体和机构信任度已经不稳固的时代,AI技术支持的假新闻和Deepfake视频的兴起助长了这一担忧。这种无法控制的误导性信息的传播可能会破坏民主的本质,使选民越来越难以做出明智的决策。

随着世界日益互联,AI驱动的宣传活动对选举的影响风险不局限于单一国家。在76个国家都有选举计划的情况下,AI操纵对全球的影响可能是巨大的。显然,迫切需要采取行动,保护民主进程的完整性,无论是在国内还是国际上。

解决这个问题需要政府、科技公司和公民社会的合作。更严格的法规和指南是必要的,以防止人工智能在政治环境中的恶意使用。此外,公众意识宣传活动和媒体素养项目可以帮助教育选民,让他们了解AI生成的虚假信息的风险。

总之,人工智能对全球民主的潜在威胁不能被轻视。现在是果断行动、共同努力确保即将到来的选举不被人工智能驱动的操纵所掩盖的时候了。民主的未来取决于我们保护选举程序的完整性和可信度的能力。… Read the rest

Title

Mixtral 8x7B: A Powerful Language Model for Diverse Applications

Mixtral 8x7B:一款强大的多用途语言模型

来自Mistral AI的研究人员开发了Mixtral 8x7B,这是一个利用稀疏混合专家模型(Sparse Mixture of Experts,SMoE)和开放权重的语言模型。这个解码模型已在Apache 2.0许可下获得许可,并且它作为一个稀疏网络的混合专家。

Mixtral 8x7B由于其独特的架构而提供出色的性能。Mixtral的前馈块由八个不同的参数组成,允许路由网络进行动态选择。这个选择过程使得每个令牌可以由两个参数组(即专家)进行处理,并将结果进行加性组合。这种策略在保持成本和延迟控制的同时,显著扩展了模型的参数空间。

Mixtral的一个突出特点是其对参数的有效利用,从而实现了在小批量和大批量大小下的更快推断时间。在基准测试中,Mixtral在多语言理解、代码生成和数学等方面展示出与Llama 2 70B和GPT-3.5等其他知名语言模型可比或更优的性能。

Mixtral在各种任务中表现出色,包括多语言理解、代码生成和数学等。该模型能够有效地从32k个令牌的上下文窗口中提取数据,而不管数据的长度和位置在序列中的位置如何。

为确保公平评估,研究团队在多个基准测试中对Mixtral和Llama模型进行了深入比较。这些评估涵盖了数学、代码、阅读理解、常识思维、世界知识和流行的聚合结果。

除了Mixtral 8x7B之外,研究人员还推出了Mixtral 8x7B – Instruct,这是一个针对指令进行优化的对话模型。通过直接优化偏好和监督微调,Mixtral – Instruct在表现上超过了GPT-3.5 Turbo和Llama 2 70B等其他对话模型。

为了鼓励广泛的获取和多样化应用,Mixtral 8x7B和Mixtral 8x7B – Instruct都已获得Apache 2.0许可,允许用于商业和学术用途。

Mixtral 8x7B的开发凸显了其在各个领域的出色性能和多功能性。从数学和代码问题到阅读理解、推理和常识知识,Mixtral作为一款强大的语言模型展现出令人印象深刻的能力。… Read the rest

两个有前途的增长股:利用Nvidia技术的人工智能解决方案

Two Promising Growth Stocks Utilizing Nvidia’s Technology for AI Solutions

摘要:本文重点介绍了两个利用Nvidia技术开发创新人工智能(AI)解决方案的增长股。尽管Nvidia本身可能不是The Motley Fool Stock Advisor分析团队的首选,但这两只股票对于寻求AI行业投资机会的投资者来说具有巨大的潜力。

在快速发展的AI领域,公司不断推动着可能性的边界。作为一家领先的技术公司,Nvidia凭借其先进的AI技术处于开发尖端解决方案的前沿。尽管根据The Motley Fool Stock Advisor的报告,直接投资Nvidia可能不是最佳选择,但还是有其他有前途的企业正在利用Nvidia的技术实现卓越增长。

其中一只股票是Cerence,该公司专门开发面向汽车的AI助手。借助Nvidia的技术,Cerence能够提供高级语音识别和自然语言处理功能,以提升驾驶体验。随着汽车行业继续采用AI驱动的解决方案,Cerence有望从这一趋势中获利,并为投资者带来可观的回报。

另一个值得考虑的股票是一家专注于AI驱动的医疗解决方案的创新型初创公司。通过利用Nvidia的技术,该公司正在通过实现更准确的诊断、个性化治疗计划和预测分析来改革医疗行业。随着对AI驱动的医疗进展的需求不断增长,这只股票有潜力改变行业并为股东带来丰厚利润。

尽管Nvidia目前可能不是投资者的首选,但这两只利用Nvidia技术的增长股在AI领域提供了有利可图的机会。随着AI行业的持续发展和演变,投资者时刻关注那些利用创新技术推动可持续增长并带来丰厚回报的公司是至关重要的。… Read the rest

Infleqtion扩充领导团队和董事会

Infleqtion Expands Leadership Team and Board of Directors

Infleqtion,一家领先的技术公司,宣布其管理团队和董事会的重大更新。这些变化反映了该公司在推动市场创新和成功方面的承诺。

布伦特·施瓦茨(Brent Schwarz)加入Infleqtion担任高级副总裁(业务发展)一职,他将在促进该公司技术在企业中的采用方面发挥关键作用。作为这个行业的一名资深人士,施瓦茨在Luminar Technologies和Uber Advanced Technologies Group等公司的经验为他的新角色带来了宝贵的专业知识。

朱莉·麦基(Julie McGee)被任命为Infleqtion的首席营销官。在这个职位上,她将监督全球品牌、制定有效的市场推广策略,并领导战略传播工作。麦基在Semtech和Intel Corporation的营销高管经验使她有能力推动公司的营销倡议。

弗农·普林斯(Vernon Prince)也加入了Infleqtion,担任全球营销副总裁一职。在这个角色中,他将专注于发展和扩大Infleqtion的量子制造能力。普林斯在这个行业的丰富经验,包括在Luminar Technologies的任期,将在拓展公司的制造能力方面起到关键作用。

除了管理方面的更新,Infleqtion还欢迎三位新成员加入其董事会。经验丰富的技术高管卡西·莱戈(Cathy Lego)带来了她在各个技术公司董事会的专业知识,包括Cirrus Logic和Guidewire Software。作为Michael Best & Friedrich LLP的合伙人,乔治·P·布什(George P. Bush)对德克萨斯市场有着深刻的了解,这将支持Infleqtion在该州的制造工作。克里斯蒂娜·约翰逊博士(Dr. Kristina Johnson)曾担任俄亥俄州立大学校长,是一位卓越的学术界人士,在董事会上带来了丰富的经验和知识。

这些领导层的变动表明了Infleqtion在技术领域推动增长和创新方面的承诺。通过向其管理团队和董事会引入经验丰富的专业人士,Infleqtion在市场上具备了良好的竞争优势。… Read the rest

智能设备和虚拟体验在CES 2024中央舞台上亮相

Smarter Devices and Virtual Experiences Take Center Stage at CES 2024

CES 2024展示了一系列技术进步,展示了智能手机应用程序可能退居次要地位的未来。从由先进的语言模型推动的语音助手到混合现实头显,科技巨头和初创公司呈现了与技术互动的创新方式,无需解锁或拿起手机。

一个值得注意的进展是Rabbit R1,这是一款小型设备,旨在成为比智能手机更智能的虚拟助手。R1利用大型动作模型(LAM)算法和OpenAI的GPT-4语言模型来自动化应用程序导航和处理过程。它通过成为一种中介,可以订餐、预订出行等,提供了传统应用使用的替代方案,让用户可以将这些任务委派给设备。

大众还通过与思凌合作,将人工智能功能融入其语音助手系统。通过整合ChatGPT,大众旨在为用户在其电动车中提供更全面的语音助手体验。增强的助手可以回答复杂的问题,消除驾驶员停车或依赖乘客搜索信息的需求。

此外,像Xreal这样的公司展示了提供更沉浸式体验的增强现实眼镜。Air 2 Ultra眼镜配备3D环境传感器,使其能够运行3D应用程序并跟踪动作。这些眼镜可以创建虚拟屏幕,让用户一边有音乐播放器,一边有YouTube视频。Xreal正在积极寻找开发者为他们的眼镜创建3D应用程序和体验,扩大了应用使用的可能性,超越了智能手机屏幕的限制。

此外,索尼宣布推出专为内容创作者设计的混合现实头显。这款头显旨在为开发者提供构建3D内容的工具,可能彻底改变我们使用应用程序的方式。苹果也加入了混合现实的潮流,推出了Vision Pro,这是一种头戴式计算机,可以在虚拟环境中创造更大的画布,以查看iPhone和Mac的应用程序。这些发展表明,传统智能手机应用程序在我们日常生活中的角色和位置正在发生转变。

虽然这些创新技术可能不会完全淘汰智能手机应用程序,但它们为未来重新想象传统应用使用提供了一个令人兴奋的展望。随着智能设备和虚拟体验变得更加普遍,我们与技术的互动注定会发展。… Read the rest

Privacy policy
Contact