天辰平台注册登录导航站
 
 

HiDream.ai发布“智象视觉多模态生成式大模型”,微软、谷歌将大模型全面整合

浏览:次    发布日期:2023-11-06

原标题:HiDream.ai发布“智象视觉多模态生成式大模型”,微软、谷歌将大模型全面整合

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

本图由Pixeling(千象)生成

本周,我们观察到以下AI领域的新动向和新趋势:

1.阿尔法公社种子轮投资的HiDream.ai正式发布了「智象视觉多模态生成式大模型」,它旗下的通用创作工具——Pixeling(千象)提供文字生成图片、文字生成视频、视频编辑等功能,并且支持中文提示词。

2.微软和谷歌将大模型能力全面整合到自己的产品,其中微软将把其Copilot嵌入到即将迎来大更新的Windows11中,并为Office套件带来全新功能,谷歌Bard则推出插件系统,正式与谷歌全家桶应用全面整合。

3.AI安全创业公司HiddenLayer获5000万美元A轮融资,是今年AI安全领域金额最大的A轮融资,它的MLSec平台为AI提供全面的安全性,旨在保护AI和机器学习模型免受各种攻击。

1.HiDream.ai 「智象视觉多模态生成式大模型」重磅发布,Pixeling可使用中文提示词

2023年9月20日,通用人工智能创新发展大会在合肥召开,HiDream.ai 智象未来创始人兼CEO梅涛院士在会上正式发布了「智象视觉多模态生成式大模型」,并展示了HiDream.ai目前的基础模型能力及应用进展。

「智象视觉多模态生成式大模型」拥有超过60亿参数,能实现文本、图片、视频等多模态内容生成,并通过交互式生成技术实现精准可控的内容生成;同时依托多模态基础模型强大的底座能力,可快速适配客户专有领域应用。自8月开放内测以来,该模型已经经历了多次迭代更新,旨在为用户提供更优化的创作体验。

基于这一大模型,HiDream.ai推出了面向所有设计师的通用创作工具——Pixeling(千象),支持创意生成、艺术创作、在线编辑等全过程的可视化。Pixeling目前已经支持文字生成图片、文字生成视频、视频编辑等功能,并计划未来推出更多的创作功能。目前,Pixeling不仅可用英文Prompt,还支持中文的提示词。

2.Windows 11深夜大更新,大模型Copilot全覆盖Office

近日,微软宣布新版Windows 11将于9月26日上线,而微软Copilot将作为Windows 11免费更新的一部分直接嵌入每一位用户的操作系统。

这次的Windows 11更新带来了超过150项新功能,其中包括为PC用户带来的Copilot强大功能,以及画图、照片等应用的全新AI体验。必应搜索也将增加对OpenAI最新DALL?E 3模型的支持,提供更加个性化的答案和全新的AI购物体验。而Microsoft 365 Copilot预计将于今年11月1日面向企业客户全面推出,这将是一款能彻底改变用户工作方式的全新AI助手。

Copilot在Office套件中的应用也是此次更新的重点。在Word、Excel、OneNote、Outlook等应用中,都将带来新功能和新能力。

3.Bard与谷歌全家桶全面整合,大模型史上首次上网自查,邮件地图文档视频一网打尽

谷歌的Bard推出插件系统,正式与谷歌全家桶应用全面整合。Bard现可从Gmail、Docs、谷歌地图、YouTube等应用中提取并总结信息,并具备了前所未有的自查功能。

这意味着用户可以更方便地从谷歌的各种应用中获取所需信息,如制定旅行计划、撰写简历、制定商业合作计划等。

此外,Bard还引入了“Google It”按钮,允许模型自我检查其回答的准确性。这一功能使Bard成为了首个能主动承认错误的模型。但这一功能仍有待完善,某些回答可能仍存在误差。

4.AI重新定义PC,英特尔CPU迎40年来最重大的架构转变

在Innovation 2023大会中,英特尔CEO基辛格(Pat Gelsinger)展示了英特尔在AI领域的新动向,他主持发布了代号Meteor Lake的酷睿Ultra处理器,新处理器带来了英特尔40年来最重大的处理器架构转变。

这款处理器首次将独立的NPU AI引擎融入其中,采用分离式模块和先进的FOVEROS 3D封装技术。此外,英特尔还预览了第五代至强处理器,预计将使机架密度提升2.5倍。在AI计算方面,英特尔展示了三代AI芯片路线图,其中5nm制程的Gaudi 3将于明年推出。

5.OpenAI祭出绘画神器,DALL·E 3联手ChatGPT,无需prompt一笔成神

OpenAI官宣了DALL·E 3,是它发布的最强文生图模型,而且它将DALL·E 3与ChatGPT进行了合并,为AI绘画圈带来了革命性的变革。

prompt 为「这幅插画描绘了一颗由半透明玻璃制成的人心,矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上镌刻着一行醒目的大字 『Find the universe within you』」

全新的DALL·E 3能够更加精准地理解语义,细节逼真,甚至能够准确呈现图像中的文本。同时,用户无需再为prompt而烦恼,只需与ChatGPT对话,即可生成精美的图像和文本。

目前,DALL·E 3仍在内测阶段,预计将在10月上旬正式推出。与此同时,DALL·E 3的发布也使得其与Midjourney的对比成为了热门话题,从多方面的对比来看,DALL·E 3在细节和准确性上都有了显著的提升。

6.ChatGPT启发,谷歌DeepMind预测7100万基因突变!AI破译人类基因遗传密码登Science

DeepMind继AlphaFold之后,再次推出了震撼生物医药领域的强大AI模型AlphaMissense,成功预测了7100万「错义突变」,其中89%的预测中,57%是致病性,32%是良性。

错义突变是一种基因突变,能够影响人类蛋白质的功能,与多种疾病如囊性纤维化、镰状细胞贫血和癌症等有关。AlphaMissense的推出展示了AI在医学、特别是遗传学领域的巨大潜力,对于理解遗传变异与疾病的关系,以及开发针对性的药物治疗都具有深远意义。

此模型的构建灵感来源于ChatGPT,通过预测多重序列比对中的氨基酸身份,进行蛋白质语言建模。AlphaMissense的预测结果与英格兰基因组学组织的研究一致,为其在真实世界中的应用提供了基准。

7.Transformer+强化学习,谷歌DeepMind让大模型成为机器人感知世界的大脑

谷歌DeepMind近日提出了Q-Transformer,旨在将大规模机器人学习与基于Transformer的现代策略架构结合。

在机器人学习方法中,整合大型多样化数据集并使用强大的模型如Transformer,可以开发出具备泛化能力的策略,使机器人处理各种任务。但大部分机器人学习模型此前都是通过监督学习方法训练的,其性能受限于人类提供的高质量演示数据。

Q-Transformer的目标是结合大规模真实世界数据集的机器人学习与Transformer。这种方法在真实世界任务上的表现优于其他基准方法。Q-Transformer的主要贡献是为机器人离线强化学习提供了基于Transformer的架构,能用于大规模多样化机器人数据集,包括真实世界数据。

DeepMind的实验结果显示,Q-Transformer在真实世界任务上的表现显著优于其他方法,并能有效地利用自动事件片段来提高技能。

8.大模型竟塞进自动驾驶,AI会解说自己怎么开车了!

英国的自动驾驶创业公司Wayve由出身剑桥大学的AI专家Alex Kendall创立,近日它们推出的LINGO-1为自动驾驶赋予了“语言”。

它们推出了LINGO-1,将大语言模型与自动驾驶技术深度融合,使车辆能够对其行为进行解释,例如解释为何在红灯前停车或为何准备左转。这一技术的核心在于一个专门的数据集,其中包含了专业驾驶员的驾驶解说,结合图像、语言和行动数据。

这种结合使得自动驾驶系统不再是一个“黑盒”,而是可以与人类进行交互和解释其决策的系统。LINGO-1的推出,不仅提高了自动驾驶的可解释性,还为其带来了更高的安全性和效率。未来,这种结合自然语言的自动驾驶技术有望为行业带来革命性的变革。

9.34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%

滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究团队联合开源了专为「通用数学问题」设计的大模型MAmmoTH及其指令调优数据集MathInstruct。

MAmmoTH系列在9个数学推理数据集上的表现显著优于现有开源模型,平均准确率提高了12%至29%。特别是,MAmmoTH-34B模型在MATH数据集上的准确率达到了46%,超越了GPT-4的结果。

数学推理问题长期是语言模型的难题,而MAmmoTH的成功为此提供了新的解决方案。该模型结合了思维链(CoT)和思维程序(PoT)的方法,能够处理从基础到高级的各种数学问题。此外,研究人员还开发了MathInstruct数据集,涵盖了广泛的核心数学领域,如算术、代数、概率、微积分和几何等。

10.上交AI数学开源模型阿贝尔,在多个权威评测集上取得开源第一

近期,上海交大生成式人工智能研究组(GAIR)研发并开源了数学计算大模型“阿贝尔(Abel)”,在多个权威评测集上取得了开源第一的成绩,成为首个由海内外高校团队推出的SOTA数学开源大模型。

阿贝尔模型在GSM8K和MATH评测集上的表现超越了多个国外大厂的模型,如PaLM-1、Minerva、Claude-instant和ChatGPT。为了训练阿贝尔,研究团队提出了Parental Oversight(家长监督)策略,强调在微调大模型时应持敬畏和谨慎态度。尽管阿贝尔在评估数据集上表现优异,但也存在过拟合、泛化性、通用性等局限。研究团队已列出这些问题,并在Github上维护限制和潜在解决方案。

11.LLM变现平台来了!LangChain+DemoGPT合作:有了idea就能挣钱

LangChain与DemoGPT宣布深度合作,推动大型语言模型(LLM)的应用开发与变现。借助DemoGPT,开发者可以利用LangChain通过自然语言构建应用程序,并在DemoGPT Marketplace展示、交换,与用户互动,获取反馈并实现应用变现。

DemoGPT简化了基于LLM的应用开发流程,能够自动生成LangChain x Streamlit应用程序。其核心功能包括规划、任务创建、代码段生成、代码段合并等,每个阶段都经过自我优化以提高效率。此外,DemoGPT Marketplace为开发者提供了一个平台,允许他们展示、交换并变现自动生成的应用程序。这一合作意味着,只需一个好的创意,即使不编写代码,也可以实现应用开发与变现。

1.HiddenLayer获5000万美元A轮融资,加速AI安全领域的发展

官方网站:hiddenlayer.com

HiddenLayer是一家专注于人工智能模型和资产安全的创业公司。它近日获得由微软风险基金M12和Moore Strategic Ventures领投的5000万美元A轮融资,这是今年AI安全领域金额最大的A轮融资。

HiddenLayer的MLSec平台为AI提供全面的安全性,旨在保护AI和机器学习模型免受各种攻击和漏洞。其核心产品MLDR提供了一种监控AI算法输入和输出的方法,为资产提供实时防御。

HiddenLayer首席执行官Chris Sestito表示,他们的目标是为每个组织提供工具和专业知识,以安全地利用AI。他强调,尽管AI的应用已经非常广泛,但没有其他技术在没有安全措施的情况下获得如此广泛的采纳。

自2022年7月起,HiddenLayer已经展现出强劲的增长和市场领导地位,与Intel和Databricks建立合作伙伴关系,并获得了多个行业奖项。公司员工数量在过去的一年中增长了近四倍,并计划在年底之前再增加40名专家。目前,该公司已为多个领域的财富100强公司的AI模型提供保护。

2.AI云安全公司Tamnoon获Merlin Ventures领投的510万美元种子轮融资

官方网站:www.tamnoon.io

AI云安全公司Tamnoon获得Merlin Ventures和Secret Chord Ventures领投的510万美元种子轮融资,Elron Ventures,Inner Loop Capital跟投。

尽管技术已经较为先进,但云安全仍然具有挑战性。如何在错误配置变成事件之前修复和防止错误配置,逐渐成为一个越来越重要的领域。

Tamnoon结合了人类专业知识和人工智能,旨在帮助团队快速、安全地修复云风险,同时限制配置更改可能对其环境造成的负面影响。

在采取任何修复措施前,Tamnoon的CloudPros会识别被警告资产的重要性、功能和敏感性,同时从技术和业务角度评估资产的可利用性或对组织的潜在威胁,设定处理优先级。此外,Tamnoon整合了与单个资产相关的重复警报,以消除核心问题中不必要的干扰。

Tamnoon由Zohar Alon、Idan Perez和Marina Segal联合创立,他们都曾在以色列安全公司Check Point Software工作多年,并在云安全领域有深厚积累。

3.将大语言模型的GPU计算量减少约50%,Enfabrica获英伟达参投的1.25亿美元B轮融资

官方网站:enfabrica.net

AI网络硬件公司Enfabrica获得由Atreides Management领投的1.25亿美元B轮融资,NVIDIA,IAG Capital Partners、Alumni Ventures等机构跟投。本轮融资后,Enfabrica融资总额达到1.48亿美元。

目前生成式AI面对的一大挑战是AI基础设施的扩展,无论是在计算的成本还是计算的可持续性方面,而传统网络芯片很难满足现代人工智能工作负载的数据迁移的需求。

Enfabrica的硬件(加速计算结构交换机,简称 ACF-S)除了在内存和网络设备之外,还可以在GPU、CPU和AI加速器芯片之间提供高达“每秒多太比特(multi-terabit-per-second)”的数据迁移。

Enfabrica声称,采用“基于标准”的接口,硬件可以扩展到数万个节点,并在相同的性能点上将大语言模型的GPU计算量减少约50%。ACF-S设备通过在数据中心服务器机架内提供高效、高性能的网络、I/O和内存,从而通过减少GPU、CPU和其他AI加速器的使用量来使运行经过训练的AI模型的公司受益。

Enfabrica由Shrijeet Mukherjee与Rochan Sankar(CEO)于2019年共同创立。前者是谷歌网络平台和架构负责人;后者毕业于多伦多大学,并在沃顿商学院攻读了MBA,曾是博通的工程总监。团队还包括几位来自思科、Meta和 Intel等公司的创始工程师。

4.无人驾驶汽车公司Conigital获得5亿英镑A+轮融资

官方网站:conigital.org

英国的无人驾驶汽车公司Conigital获得5亿英镑A+轮融资,这笔资金来自于与一家管理1500亿英镑资产的全球私募。

Conigital致力于开发名为ConICAV?的无人驾驶平台,该平台可为各种车辆提供改装和定制建造服务,尤其是为工业和商业车队。其独特的远程监控和操作平台采用了可解释的AI和模拟优先的方法,确保了系统的可扩展性和快速的迭代更新。

Conigital的技术已在机场、港口、物流场地、工业区和智能园区等特定环境中得到早期商业应用。目前,该公司在澳大利亚、巴西和印度均有业务布局。

Conigital首席执行官Don Dhaliwal表示,这次融资的资金将用于吸引顶尖人才,扩展合作伙伴网络,并实施并购策略,以在国内外进一步扩张。

5.重塑医疗AI,DeLoreanAI获755万美元A轮融资

官方网站:deloreanai.com

DeLoreanAI近日完成由Sopris Venture Capital领投的755万美元的A轮融资,Pinta Capital Partners和Oak Street Health的前高管James Chow参投,这使得公司总融资额达到约1100万美元。

DeLoreanAI的核心产品是其医疗AI系统,该系统为医务人员和保险公司提供有关患者健康状况的关键洞察。与传统AI工具不同,DeLoreanAI不仅提供预测,还能实时生成下一步的最佳行动建议,帮助医务人员更好地制定治疗方案。

DeLoreanAI首席执行官MacLaughlin表示,他们的AI预测已经得到了三个独立组织的验证,确保其准确性。

其中,United Healthcare已将DeLorean的算法应用于其数千万患者的记录上,每天处理超过4000万患者的数据。DeLorean的系统旨在为高风险患者提供预防性治疗,预计每位患者可以节省数万美元的医疗费用。例如,对于糖尿病患者,每年可以节省2800美元,而对于接受透析的患者,每年节省金额可达15000美元。

6.Scala Biodesign获得由TLV Partners领投的550万美元种子轮融资

官方网站:www.scala-bio.com

Scala Biodesign获得以色列早期投资机构TLV Partners领投的550万美元种子轮融资。Scala的创始人表示他们可以加速工程治疗分子的最慢的方面。

Scala Biodesign由联合创始人兼首席执行官Ravit Netzer博士和首席技术官Adi Goldenzweig博士创立。Netzer博士和Goldenzweig博士研究并开发了重新设计天然蛋白质的算法,称为PROSS,该算法产生的变体可改善半衰期和热稳定性。目前,PROSS被用于各种商业应用,Scala Biodesign正与几家制药公司合作开展蛋白质工程项目。

Scala Biodesign的算法利用人工智能、基于物理的建模和天然蛋白质的数据来设计和改进蛋白质,以开发新药物、疫苗和抗体,并为食品科技和工业酶制剂创造蛋白质,可帮助企业以更快的速度、更低的成本开发出新的药品和食品,甚至可以创造出传统方法无法实现的全新生物技术应用。

本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。

关于阿尔法公社

返回搜狐,查看更多

责任编辑:

平台注册入口