Seedance 1.0 lite – 火山引擎推出的视频生成模型,支持文生视频和图生视频Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。支持360度环绕、航拍、变焦...发现资讯5个月前06540
Voquill – 开源AI语音输入工具,语音输入速度是键盘输入的四倍voquill是一款开源语音输入工具,旨在以语音替代传统键盘输入,可在任何文本框和应用程序中使用,实现系统级的通用兼容性。显著提升写作与信息记录的效率,并利用 AI 自动清理转录内容。定位为一个比打字...发现资讯4个月前06530
Nemotron 3 – 英伟达推出的最新开源AI模型系列,提升推理的准确性和适应性。英伟达发布了 Nemotron 3 系列开放模型,共三种规模,分别为 Nano、Super 和 Ultra,支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 ...发现资讯5个月前06530
Qoder CLI – Qoder团队推出的AI命令行工具,响应时间不到 200 毫秒阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架,支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行,显著...发现资讯7个月前06530
WorldGen – Meta推出的3D世界生成端到端系统,几分钟内生成完整的 3D 世界。Meta 推出了 WorldGen,这是一种端到端系统,可仅凭单条文本提示词,自动生成可交互、可导航的三维世界,不仅具备高度沉浸感,更支持用户真正步入其中、自由探索。WorldGen 融合了程序化逻辑...发现5个月前06520
TapNow是一个多功能平台,提供AI精准控制生图与生视频功能TapNow 是一个多功能平台,提供AI精准控制生图与生视频功能,支持涂鸦生图、涂鸦生视频及姿势控制。用户可上传图片并标注区域,通过英文提示词实现多主体交互、添加特效(如蓝色火焰)或修改背景。它能指代...发现6个月前06520
LongCat-Image – 美团推出的开源图像生成模型,提供强大的图像编辑能力美团LongCat团队宣布,开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构,结合渐进式学习策略,成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...发现资讯5个月前06500
Seedream 4.5 – 字节跳动推出的AI图像创作模型,增强画面的立体感、光影效果字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在图像生成主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了的整体质量与稳定性。面向广告...发现资讯5个月前06460
LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯5个月前06450
Firefly Image 5 – Adobe推出的最新图像生成模型,支持400万像素原生输出Adobe上线其最新一代图像生成与编辑模型Firefly Image 5,新模型支持400万像素原生输出,提供图像分层编辑等图像功能,还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升,特别是在人...发现资讯6个月前06450