当前位置：首页 > 视频 > 正文内容

HiDream.ai将把AI生成视频时长提升到15秒，Harvey获得8000万美元新融资

早间资讯网5个月前 (01-01)视频29

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者（AlphaFounders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本图由“千象”（网址：）生成

本周，我们观察到以下AI领域的新动向和新趋势：

1.阿尔法公社种子轮投资的HiDream.ai将推出能生成15秒时长AI视频的新产品。它的图片生成平台 “Pixeling 千象” 以及面向电商平台 AIGC 工具 “PixMaker”在商业化方面进展顺利。

2.法律AI工具Harvey获得8000万美元B轮融资，它的收入增长了十倍多，为大客户推出定制模型。

3.字节跳动推出GR-1机器人操作模型，模型基于Transformer，显著提升机器人在多任务操作方面的性能和泛化能力。

人工智能产品和技术的新突破

1.HiDream.ai视频生成已打破业界4秒瓶颈，能支持15秒以上视频

近期，视频生成技术的进步成为大众眼中AIGC的一个新焦点，马斯克直接做出预判称，明年将是 “人工智能电影” 元年。

但是目前的视频生成工具大多只能支持4秒左右的视频生成，超过4秒就会出现一系列问题，包括准确性、一致性以及时长限制等。其中视频生成的时长性限制在商业化应用上是重要的掣肘。在15秒的生成长度下，基本可以覆盖常见短视频的生成需要，而4秒则很难。

阿尔法公社种子轮投资的HiDream.ai在即将推出的新产品中，将能够生成15秒钟左右的视频，并在准确性、一致性等方面有所突破。

HiDream.ai由原京东副总裁、前微软研究院资深研究员梅涛院士创立。梅涛是加拿大工程院外籍院士、IEEE/IAPR/CAAI Fellow，是多媒体领域荣获国际最佳论文奖最多的华人学者（15 项），也是科技部科技创新2030人工智能重大项目首席科学家。

自公司成立以来，HiDream.ai基于其底层视觉大模型推出了图片生成平台 “Pixeling 千象” 以及面向电商平台 AIGC 工具 “PixMaker”，两个工具在商业化上都实现了一定进展。

机器之心对梅涛院士的最新专访，请参考：梅涛：HiDream.ai视频生成已打破业界4秒瓶颈，能够支持15秒以上

2.OpenAI、微软被起诉！《纽约时报》指控AI侵权，要求销毁侵权模型和训练数据

OpenAI和微软近日面临了一起可能成为AI侵权领域里程碑式案件的诉讼，原告是《纽约时报》。《纽约时报》提交了一份长达220,000页的附件，指控ChatGPT输出的内容与其新闻内容高度相似，构成了版权侵犯。

《纽约时报》要求OpenAI和微软销毁包含侵权材料的模型和训练数据，并对非法复制和使用《纽约时报》独有价值的作品相关的“数十亿美元的法定和实际损失”负责。

诉状中提出的关键点包括：《纽约时报》文章构成了用于训练GPT的最大单个专有数据集，证据充分。《纽约时报》聘请了强大的律师团队，使这起诉讼成为一次策略性的法律挑战。

《纽约时报》的诉讼可能会对OpenAI和微软造成重大影响，尤其是在版权保护和AI技术应用的法律边界方面。这起案件可能成为AI侵权领域的一个重要转折点，其结果将对整个行业产生深远影响。

3.史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

苹果公司与德国马普所合作推出的3D数字人合成工具HUGS，它能在半小时内完成数字人的训练，并在16毫秒的时间里渲染出动作流畅、细节丰富的场景视频。这大大缩短了从视频捕捉到数字人生成的时间。

HUGS的核心技术在于其高效的处理方式。它通过分析简短的视频片段（50-100帧），提取人物骨骼信息，进而生成数字分身，并能在不同场景中实现各种动作。这个数字人不仅能够融合到各种场景中，而且其帧率可以超过原始素材，达到60FPS，提供更加流畅的视觉体验。

HUGS的细节处理能力也超越了以往的技术。在对比测试中，HUGS在NeuMan数据集的五个场景中的PSNR和SSIM评分均达到了最高水平，而LPIPS误差则处于最低。

HUGS的技术原理是将人物和场景转化为3D高斯斑点，通过多层感知机（MLP）和SMPL（一种人体形状模型）进行处理和优化。这种方法不仅提高了渲染速度，还保证了生成图像的细节和真实性。

4.华为诺亚的盘古Agent来了，让智能体学会结构化推理

华为诺亚方舟实验室、伦敦大学学院（UCL）、牛津大学的研究者们共同提出了一种新型的AI智能体框架—盘古智能体（Pangu-Agent），旨在解决AI智能体在复杂环境中的多任务处理问题。

这一框架的核心创新在于将智能体的内部思维过程形式化为结构化推理，并展示了通过监督学习和强化学习来微调智能体的方法。

盘古Agent的主要贡献在于证明了结构化推理在智能体框架中的重要性。它作为一个元智能体框架，可以通过内部函数调用的顺序进行调整或微调，或将决策委托给底层LLM。这使得使用者可以轻松扩展智能体的功能，并组合或重用多种已实现的方法。

研究者在七个LLM和六个不同领域上进行了评估，证明了框架的监督微调（SFT）和强化学习微调（RLFT）的有效性。通过结构化推理，盘古Agent在ALFWorld领域的成功率从27%增加到82%，在BabyAI任务的成功率提高到88%，甚至从28%提高到91%。此外，跨领域实验显示，通过RL训练的单个LLM能够同时在多个领域实现高性能。

5.字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

字节跳动最近提出了名为GR-1的机器人操作模型，它采用transformer架构，其核心创新在于利用大规模视频数据（800万张图片）进行生成式预训练，从而显著提升机器人在多任务操作方面的性能和泛化能力。

这种预训练方法在CALVIN机器人操作仿真数据集上取得了SOTA的结果，包括在多任务学习、零样本场景迁移、少量数据处理和零样本语言指令迁移等方面的表现。

真机实验中，GR-1完成了包括移动物体和开关抽屉等多种任务。实验结果表明，GR-1在真机实验中的表现也大幅领先于现有方法。消融实验表明，预测未来帧和预训练对GR-1学习鲁棒的机器人操作起到了关键作用。

6.挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

Mamba这项新研究被认为在语言建模方面具有挑战Transformer的潜力，它的核心是一种新架构—选择性状态空间模型（Selective State Space Model, SSM）。Mamba论文的作者之一Albert Gu在其博士论文中提出，SSM是对传统深度学习模型的一种创新，特别是在处理长序列数据时显示出其优越性。

论文指出，虽然Transformer模型在大规模数据处理方面取得了巨大成功，但其自注意力机制在处理长序列时的计算量呈平方级增长，这限制了其效率。

Mamba的核心思想是利用状态空间模型（SSM）进行深度序列建模。SSM是一种灵活的方法，具有理论基础，计算效率高，并能在多种数据模态和应用中取得强大的结果。它能够概括标准深度序列模型（如循环神经网络和卷积神经网络）的优势，同时克服了这些模型在处理长序列数据时的局限性。

论文还讨论了深度序列模型面临的三大挑战：通用能力、计算效率和长程依赖问题。SSM通过其连续性、循环性和卷积系统特性，提供了一种通用序列模型，能够在并行和序列环境以及各种领域中高效运行。此外，作者还介绍了结构化状态空间序列模型（S4）和HIPPO框架，这些都是为了提高SSM的计算效率和处理长程依赖关系的能力。

此前我们详细介绍过Mamba的另一位作者Tri Dao参加的创业公司

together.ai，欢迎参考：together.ai让AI模型训练快9倍，获NVIDIA参投1.025亿美元A轮融资｜AlphaFounders

7.大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

DeepMind最近的研究提出了一种新的大模型微调方法，这种方法减少了对人类生成数据的依赖，而是采用了带反馈的自训练（ReST^𝐸𝑀）方法。

这种方法的核心在于利用模型自身生成的数据进行训练，同时引入外部标量反馈信号作为每个生成样本的质量指标。

ReST^𝐸𝑀方法包括两个主要步骤：生成（E-step）和改进（M-step）。在生成步骤中，语言模型为每个输入上下文生成多个输出样本，然后使用二元奖励过滤这些样本以收集训练数据集。在改进步骤中，原始语言模型在来自前一个E-step的训练数据集上进行监督微调，然后在下一个E-step中使用。

研究者们使用了这种方法对PaLM 2模型进行了实验，特别关注了数学推理和代码生成两个领域。实验结果表明，ReST^𝐸𝑀方法在这两个领域上都取得了显著的性能改进。与在人类编写数据上训练的模型相比，使用模型生成的合成数据进行微调的模型显示出更大的性能增益。此外，这些微调后的模型在相关但未涉及的基准测试中也表现出了性能提升。

8.李飞飞DeepMind全新「代码链」碾压CoT！大模型用Python代码推理，性能暴涨12%

DeepMind、斯坦福和UC伯克利的研究团队最近提出了一种名为「代码链」（Code Chain，简称CoC）的技术，这一技术被认为是对思维链（Chain of Thought，简称CoT）技术的重要颠覆，在论文中，李飞飞作为作者之一署名。

CoC通过将编码逻辑与自然语言理解相结合，显著提升了大型语言模型（LLM）基于代码的推理能力。这种方法允许LLM生成「伪代码」来分解难题，并通过LMulator执行有效代码，模拟无效代码。在BIG-Bench Hard基准测试中，CoC实现了84%的准确率，比CoT提高了12%，在18项任务中超过了人类的平均表现。

「代码链」的核心思想是鼓励大模型将程序中的语义子任务格式化为灵活的伪代码。这些伪代码在运行时可以被明确捕捉，并交给LLM进行仿真。

例如，给定任务「在上面的段落中，数一数这个人讽刺了多少次」，可以提示LLM调用辅助函数is_sarcastic(sentence)，然后LM对此进行语言预测，并将结果作为布尔结果输出返回，与程序的其余部分一起处理。

人工智能初创公司的新融资

1.生成式法律人工智能Harvey获得Elad Gil，OpenAI和红杉美国等投资的8000万美元B轮融资

官方网站：

法律人工智能公司Harvey，继4月获得2100万美元A轮融资后，近日又获得Elad Gil和Kleiner Perkins共同领投，OpenAI的初创基金、红杉资本参投的8000万美元B轮融资，目前总融资额超过1亿美元，估值为7.5亿美元。

Harvey对于律所工作的改变主要在4个方面：改变法律研究的方式（帮助律师筛选文件，提取关键信息）；自动化合同分析，帮助提高效率；处理文档管理和日程安排，节省律师时间，进而提高客户满意率；将劳动密集型任务的自动化，节省律所费用。

此前，Harvey基于GPT-4构建自己的专有服务；现在，Harvey开发了针对大客户的复杂需求开发法律领域的定制模型，并努力消除模型的“幻觉”。

自4月份以来，Harvey收入增长了十倍多，目前公司的服务的候补名单有超过15,000家律师事务所，Allen Overy和Macfarlanes 。此外，普华永道与Harvey签订合作协议，预计合作推出了一款新型法律聊天机器人。

Harvey由Gabe Pereyra（CEO）与Winston Weinberg于2022年联合创立。Gabe来自人工智能研究的前沿，他从牛津的神经科学博士辍学，之前是Meta的大语言模型研究员，并且是连续创业者；Winston则具有蓝筹股公司（blue-chip securities）和反垄断诉讼背景。

2.人工智能精准医疗服务提供商ImpriMed获得Softbank Ventures Asia领投的2300万美元A轮融资，SK Telecom参投

官方网站：

近日，ImpriMed完成了2300万美元的A轮融资。本轮融资由Softbank Ventures Asia领投，HRZ Han River Partners、SK Telecom、KDB Silicon Valley、Ignite Innovation Fund、Samyang Chemical Group、Murex Partners和Byucksan参投，公司目前总共融资3470万美元。

ImpriMed总部位于美国硅谷，目前它瞄准的是兽医市场，使用AI对犬类和猫类癌细胞进行全面分析来做出个性化药物反应预测的精准医疗，未来它将会用经过验证的平台把业务拓展到人类肿瘤学领域。

对于癌症精准医疗，传统的治疗方案往往浪费了大量时间和金钱在无效治疗中，缺乏精准度和高效性。ImpriMed建立了一个AI平台，使肿瘤学家能够快速确定哪些可用药物可以为当前病患提供最佳临床结果。

它将定量高通量实验室测试和AI相结合，为病患提供全面的个性化药物预测分析文件。它的AI模型使用专有的真实临床结果数据库和实验室测试架构进行训练，其中包括创新的体外药物敏感性测定，该测定可测量患者的活肿瘤细胞对一组抗癌药物的反应。

ImpriMed由Sungwon Lim（CEO）和Jamin Koo（CTO）联合创立，他们都是斯坦福大学和韩国科学技术院KAIST的杰出校友。Sungwon Lim曾在韩国生物制药公司ViroMed担任研究科学家。Jamin Koo目前是弘益大学的助理教授。

3.做AI仓储机器人的GreyOrange获1.35亿美元D轮融资

官方网站：

人工智能仓储机器人制造商GreyOrange宣布完成1.35亿美元A轮融资。本轮融资由Anthelion Capital领投，Mithril、3State Ventures和Blume Ventures等参投。目前该公司总共融资超4.28亿美元。

在全球供应链环境中，公司需要为优化库存花费大量的时间和资源，且实际效率较低。GreyOrange开发人工智能驱动的软件和移动机器人对订单履行进行现代化处理，能够大大提高仓储运营的效率和收益率。

在软件上，它的GreyMatter操作系统能够与机器人进行集成，机器人利用其内核中内置的GreyMatter软件与其他机器人以及与中央系统进行通信，从而在软件大脑中的算法与车间的实时操作之间产生连续的反馈。

在运营过程中，GreyMatter会考虑有关订单，库存，运输窗口和资源的预测性和实时数据，以协调工人和机器人如何在适当的时间完成正确的订单。

GreyOrange由Akash Gupta（现任CEO）和Samay Kohli（前任CEO）于2011年共同创立。两人是印度知名学府博拉理工学院的校友，并且都是印度最早的本土人形机器人研发团队AcYut的成员。

4.人工智能安全决策智能平台Arcanna.ai获得350万美元种子轮融资

官方网站：

近日，Arcanna.ai完成由Lytical Ventures领投，Osage Venture Partners、Defined、Isometric Ventures和John Stewart参投的350万美元种子轮融资。

要应对越来越多的网络威胁、数据过载、警报疲劳和误报激增，网络安全专业人员面临着巨大的挑战，导致团队疲惫和高离职率，以及行业技能短缺导致的安全漏洞风险。

作为安全决策智能平台，Arcanna.ai通过将生成式AI与人工方法的独特融合，将决策能力提高10倍，显著缩短对攻击的响应时间。

Arcanna.ai具有完美的兼容性，无论用户在网络安全运营中使用何种工具、拥有怎样的工作流程以及数据模式，它都无需编码或新界面即可“无形地”融入现有工作流程，极大的降低了使用门槛。

Arcanna.ai由Peter Ruta（CEO）、Bogdan Perian（CTO）、Cristian Ruta（COO）和Calin Cornigeanu（CPO）于2019年共同创立。Peter Ruta是一名连续创业者，曾创立网络安全平台Siscale（Arcanna.ai的前身），曾在思科作为高级经理和安全服务负责人工作超过14年，其他几位联合创始人也拥有丰富的行业经验。

5.基于AI的新型操作系统Rabbit再获由Khosla Ventures独家领投的1000万美元A轮融资

官方网站：

继此前获得2000万美元种子轮融资后，Rabbit再获现有投资者Khosla Ventures追加的1000万美元A轮融资。目前，公司的募集资金总额至3000万美元。

Rabbit的创始人认为，当前基于应用程序的操作系统，无论对于用户还是开发人员，都是脱节且繁琐的，他致力于用大型行动模型（LAM）来理解人类的意图，使人类可以使用自然语言与任何软件进行交互。

Rabbit的核心产品是Rabbit OS，允许用户使用自然语言而不是通过应用程序和菜单与其设备进行交互，其能理解复杂的用户意图，进而操作用户界面并为用户执行相应的操作。

支持Rabbit OS的底层模型是LAM。大型行动模型 (LAM)于10月首次推出，它能够理解人类意图并根据人类意图采取大语言模型无法进行的实际行动。与生成式AI聊天机器人不同，LAM无需应用程序编程接口 (API) 等定制集成即可完成任务。

Rabbit由Jesse Lyu、Alexander Liao和Justin Oren联合创立。联合创始人兼首席执行官Jesse Lyu是一位连续创业者，是timeet、Raven Tech（渡鸦科技）的联合创始人兼CEO，Alexander Liao曾担任CMU深度学习领域的研究员，并以首席机器学习工程师的身份在大语言模型公司Praxis Pioneering工作2年。

6.个人AI生产力助手的Shelpful获得300万美元种子轮融资

官方网站：shelpful.com

Shelpful近日获得Apollo Projects（Sam Altman及其兄弟创立）的300万美元种子轮融资。

Shelpful提供基于GPT-4的AI生产力助手—HabitGPT，它能帮助自由工作者和学生进行日程管理和习惯培养，提高他们的工作效率。它能嵌入WhatsApp，主动向会员发起对话，检查待办事项列表，提供个性化提醒，并跟进核心任务。

它还能与人类教练提供混合服务，帮助ADHD（注意力缺陷多动障碍）人群缓解症状，养成更好的工作和生活习惯。

Shelpful由Chris Morse（CTO）、Sharon Pope（CEO）、Lydia Swift联合创立。Chris Morse曾任亚马逊Alexa项目的高级技术经理，并于2000年创立了Morse Best Innovation。Sharon Pope曾任Green Dot Corporation的首席营销官、Y Combinator的营销项目主管，Lydia Swift曾任万卓环球副总裁。

7.人工智能生物医药公司Brightseed获得BillMelinda Gates基金会160万美元赠款

官方网站：

近日，人工智能和生物科学领域的先锋公司Brightseed收到了来自BillMelinda Gates基金会的第二笔赠款（160万美元）。Brightseed于2022年8月完成了B轮融资，迄今为止共融资1.208亿美元。

Brightseed专注于发现自然界中的化合物，以增强人类健康。传统生物科学方法耗时较长且资源密集，Brightseed使用AI驱动平台Forager显著加速了生物活性化合物的发现和验证过程，将研究时间从数年缩短到数月。

Brightseed的工作重点在于生物活性物质，这些生物活性物质可以激活身体中的特定受体，触发支持健康和日常功能的生物学反应。Brightseed的AI技术Forager已经绘制了400万种植物化合物，识别了30000种预测的生物活性物质，覆盖了22个健康领域。

Brightseed的联合创始人包括Jim Flatt（CEO）、Sofia Elizondo（COO）和Lee Chae（CTO）。Lee Chae于斯坦福大学的卡内基研究所完成了博士后研究，同时也是加州大学伯克利分校定量生物科学研究所的创始成员。在共同创立Brightseed前，Lee Chae在Hampton Creek担任研发副总裁，带领团队发现了新的食品蛋白。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作，封面图片由Hidream.ai的Pixeling（千象）生成。

关于阿尔法公社

免责声明：本站部分内容来自网友自行上传或转自网路，如有侵犯您的利益请联系我们。我们会尽快处理并致以最深的歉意。邮箱：marssir@vip.qq.com

本文链接：https://news.zaojiaoguan.com/news/26571.html

标签: 时长融资生成提升获得

分享给朋友：

返回列表

上一篇：视频回顾：2024年奥克兰烟花秀！

下一篇：视频丨习近平：祝愿祖国繁荣昌盛、世界和平安宁！

“HiDream.ai将把AI生成视频时长提升到15秒，Harvey获得8000万美元新融资” 的相关文章

HiDream.ai将把AI生成视频时长提升到15秒，Harvey获得8000万美元新融资

“HiDream.ai将把AI生成视频时长提升到15秒，Harvey获得8000万美元新融资” 的相关文章

ai生成动漫图片

AI写文案工具有哪些，10款AI写文案生成软件推荐

拼多多DSR如何提升

提升审批效率厦门两经验全省推广

提升销售效率：电销话术与技巧的实用指南

智能销售：生成式AI如何改变游戏规则

法媒报道：科幻小说热提升中国软实力

电子科技大学成都学院教师获得发明专利授权

关于我们-文章-标签-地图
Copyright 早间资讯网  闽ICP备2022000160号-1