查看原文
其他

Stable Diffusion 3 Medium开源;Luma发布AI视频生成工具Dream Machine | AI日报

头号AI玩家 AI新榜
2024-09-25

欢迎围观“头号AI玩家”的「AI日报」栏目。AIGC前沿资讯,及时拿捏!


【1分钟速看版】


 🗣 科大讯飞:将于6月27日发布讯飞星火V4.0,提供多项GPT-4o不具备的能力
📗 微信读书集成腾讯混元AI大模型:有用户宣称“可以一日千页”
💡 美图设计室发布V3版本:支持AI批量设计和商品视频生成
🤖 发布仅3个月,微软Copilot GPTs官宣停服
🎨 Midjourney推出模型个性化功能
📣 OpenAI紧急澄清,和微软云合作不会变化
🍎 苹果仍在寻找中国AI供应商,与OpenAI合作财务条款曝光
🔍 Stability Al开源Stable Diffusion 3 Medium文生图模型

国内资讯


1. 微信读书集成腾讯混元AI大模型:有用户宣称“可以一日千页”

6月12日消息,微信官方称腾讯混元集成在微信读书App后,用户的读书效率大增,有用户宣称“可以一日千页”。

借助腾讯混元大模型,微信读书推出“AI问书”功能,遇到不懂的名词和问题,通过搜索框搜索或长按书籍原文,即可借助AI力量获得解释与回答。


此外,AI会整理书籍引源,并通过用户提问进一步预设问题,层层深入推进读者对书本知识的理解。(来源:站长之家)

2. 科大讯飞:将于6月27日发布讯飞星火V4.0,提供多项GPT-4o不具备的能力


6月11日消息,科大讯飞董事长刘庆峰在公司成立25周年司庆活动透露,科大讯飞将于今年6月27日发布讯飞星火V4.0,这款新版本将展示最新的端到端智能语音技术成果,并且科大讯飞还计划在未来三季度推出其端到端的语音技术建模方案。


此外,科大讯飞还将为用户提供GPT-4o所不具备的一句话复刻、高噪音场景语音识别以及多方言多语种免切换功能。(来源:站长之家)

3. 美图设计室发布V3版本,支持AI批量设计和商品视频生成

6月12日消息,美图公司旗下AI图像和设计创作平台“美图设计室”更新至V3版本,新增Al批量设计、AI商品视频和团队协作等3大核心能力。

据悉,美图设计室目前每月活跃用户数超过1700万,每月产生的电商物料数量达4000万。(来源:综合消息)

(来源:美图设计室视频号)

海外资讯


4. OpenAI紧急澄清,和微软云合作不会变化

北京时间6月12日,OpenAl在社交平台X上正式回应了与美国第四大云服务提供商甲骨文的合作关系。


OpenAI表示:“我们想要澄清一些无意中产生的误解。我们与微软的战略性云合作关系没有变化。我们与OCl(Oracle Cloud Infrastructure,甲骨文云基础设施)的合作使我们能够在OCI的基础设施上使用微软的Azure Al平台来进行推理和其他需求。我们所有前沿模型的预训练仍然在与微软合作构建的超级计算机上进行。”

事情的起因要追溯到甲骨文首席执行官Safra Catz于6月12日凌晨宣布的消息,她表示,甲骨文在第四季度就签署了30多份AI销售合同,总额超过125亿美元,其中包括与OpenA合作,在Oracle Cloud中训练ChatGPT。(来源:APPSO)

5. Midjourney推出模型个性化功能

北京时间6月12日,Midjourney推出了一项创新的模型个性化功能,允许用户根据审美偏好微调MJ模型,使生成的图像更贴近个人喜好。个性化模型通过分析用户喜欢的图片来实现,学习用户独特审美,满足用户品味。用户需对至少200张图片进行评分或点赞,启用个性化功能后,在提示后添加特定代码分享个性化效果。

(来源:Tatiana Tsiguleva社媒账号)

X网友Tatiana Tsiguleva尝试了这一功能,并表示该功能确实反映了她的极简主义喜好:“现在我开始有点惧怕AI了!”(来源:综合消息)

6. Stability Al开源Stable Diffusion 3 Medium文生图模型

北京时间6月12日晚间,人工智能初创公司Stability Al宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Medium(SD3Medium)。


Stable Diffusion 3 Medium包含 20 亿个参数,是 Stability Al迄今为止最先进的文本到图像开放模型,更小的VRAM占用空间旨在使其更适合在消费级GPU以及企业级GPU上运行。(来源:Stability Al)

(来源:Stability AI官方宣传片)

7. 苹果仍在寻找中国AI供应商,与OpenAI合作财务条款曝光

北京时间6月13日,据彭博社报道,苹果公司本周发布了AI系统苹果智能(Apple Intelligence),但是知情人士称,苹果尚未就聊天机器人功能与中国本土AI供应商达成协议,但一直在考虑与百度、阿里巴巴集团等公司合作。

(来源:彭博社)

与此同时,彭博社还披露了苹果与OpenAI合作的财务条款。ChatGPT将在苹果产品上免费提供,但OpenAI和苹果仍然可以通过将免费用户转化为付费帐户来赚钱。目前,如果用户通过ChatGPT应用在苹果设备上订阅OpenAl,这个过程将使用苹果的支付平台,传统上苹果会从中分成。(来源:凤凰网科技)

8. 发布仅3个月,微软Copilot GPTs官宣停服

6月12日,微软在官网宣布,Copilot GPTs将于7月10日起停服,用户已经创建的GPTs将被清空,而这距离Copilot GPTs的发布仅仅过去3 个月时间。

微软在其官网上表示,公司正在进行战略调整,将GPT的重点转向商业和企业场景,而非消费者市场,这一决策背后的可能原因是Copilot GPTs在商业回报上的缺乏。(来源:凤凰网科技)

(来源:微软官网)

今日话题


Luma推出AI视频生成工具Dream Machine,媲美Sora,免费试用!


Luma今天凌晨发布了效果堪比甚至超越Sora的视频生成工具Dream Machine,可通过文本、图片快速生成高质量视频,用户可直接注册免费使用。

X网友开启疯狂体验模式,从视频质量来看,效果还不错!


1. 文生视频


(来源:Allen T.社媒账号)

Prompt: zoom in shot of a demon standing in front of a massive fire flapping its wings


2. 图生视频


Dream Machine除了支持文本之外,还可使用图片作为引导来生成视频,其生成的视频质量、动作一致性、色彩、光影、饱和度、运镜等方面,可以媲美OpenAI的Sora。


X网友Tatiana Tsiguleva将Midjourney与Luma相结合,效果惊人的好。


(来源:Tatiana Tsiguleva社媒账号)

总的来说,Dream Machine拥有以下特点:

特点1:快速生成视频,120秒即可生成120帧视频

 

特点2:动作非常流畅,可生成5秒带有逼真平滑动作、摄影和戏剧效果的视频片段


特点3:角色一致性极强,理解人物、动物和物体与物理世界的互动,创造具有高度角色一致性和准确物理效果的视频

 

特点4:运镜非常自然,完美匹配场景情感


此外,Dream Machine支持物理模拟,这意味着生成的视频更能体现出物理世界的特点,包括重力下落、碰撞、光影变化等。


感兴趣的玩家可直接访问官网进行体验:


https://lumalabs.ai/dream-machine


(整理:左卡)




「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。


欢迎分享、点赞、在看

 一起研究AI


继续滑动看下一个
AI新榜
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存