发现 - 第39页

发现科技资讯

排序

发布更新浏览点赞

Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型，整体效果自然流畅。

字节跳动推出的Seedance 1.5 Pro模型，具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步，实现较高的视听一致性，且支持多种语言和地方方言口音，能够捕捉其独有的语音韵律与情...

发现资讯

6个月前

06690

UnityVideo – 港科大联合可灵快手开源的视频生成框架，实现视频内容的多模态解析

港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo，一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制，实现 RGB 视频与辅助模态之间的双向学习，加速...

发现资讯

6个月前

06690

LuxReal – 群核科技推出的AI 3D视频创作平台，快速生成高质量

群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal，基于图像、3D 模型等多模态输入，快速生成主体一致、画面可控的视频内容，适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...

发现资讯

6个月前

06680

GPT-5.2-Codex – OpenAI推出的智能体编程模型，能高效生成高质量的代码

gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型，聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术，让其在处理代码重构、迁移等长...

发现资讯

6个月前

06670

Qoder CLI – Qoder团队推出的AI命令行工具，响应时间不到 200 毫秒

阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架，支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行，显著...

发现资讯

9个月前

06660

Nemotron 3 – 英伟达推出的最新开源AI模型系列，提升推理的准确性和适应性。

英伟达发布了 Nemotron 3 系列开放模型，共三种规模，分别为 Nano、Super 和 Ultra，支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 ...

发现资讯

6个月前

06640

TapNow是一个多功能平台，提供AI精准控制生图与生视频功能

TapNow 是一个多功能平台，提供AI精准控制生图与生视频功能，支持涂鸦生图、涂鸦生视频及姿势控制。用户可上传图片并标注区域，通过英文提示词实现多主体交互、添加特效（如蓝色火焰）或修改背景。它能指代...

发现

7个月前

06630

LongCat-Image – 美团推出的开源图像生成模型，提供强大的图像编辑能力

美团LongCat团队宣布，开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构，结合渐进式学习策略，成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...

发现资讯

7个月前

06600

WorldGen – Meta推出的3D世界生成端到端系统，几分钟内生成完整的 3D 世界。

Meta 推出了 WorldGen，这是一种端到端系统，可仅凭单条文本提示词，自动生成可交互、可导航的三维世界，不仅具备高度沉浸感，更支持用户真正步入其中、自由探索。WorldGen 融合了程序化逻辑...

发现

7个月前

06600

Firefly Image 5 – Adobe推出的最新图像生成模型，支持400万像素原生输出

Adobe上线其最新一代图像生成与编辑模型Firefly Image 5，新模型支持400万像素原生输出，提供图像分层编辑等图像功能，还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升，特别是在人...

发现资讯

8个月前

06590

加载更多