LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯6个月前06580
LongCat-Image – 美团推出的开源图像生成模型,提供强大的图像编辑能力美团LongCat团队宣布,开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构,结合渐进式学习策略,成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...发现资讯6个月前06580
Firefly Image 5 – Adobe推出的最新图像生成模型,支持400万像素原生输出Adobe上线其最新一代图像生成与编辑模型Firefly Image 5,新模型支持400万像素原生输出,提供图像分层编辑等图像功能,还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升,特别是在人...发现资讯7个月前06550
SceneGen – 上海交大推出的3D场景生成框架,单图到3D场景一步生成上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架,在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入,能够在一次前向传播中,同时生成场景内多个3D资产的几何、纹...发现资讯8个月前06550
LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...发现资讯8个月前06540
Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...发现资讯9个月前06540
LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,打破...发现资讯6个月前06530
LensGo AI – AI内容创作平台,无需专业剪辑技能,满足多样化创作需求随着科技的飞速发展,越来越多的技术工具涌现出来,LensGo凭借其强大的功能和简洁的操作界面,受到了广大用户的青睐。用户可以轻松实现图像的编辑、优化、分享等操作,提升工作效率和创作体验。允许用户通过简...发现资讯6个月前06530
Workspace Studio – 谷歌推出的AI智能体构建工具,自动生成定制化 AI 智能体谷歌发布的一款 ai 驱动 自动化工具Workspace Studio,支持用户通过自然语言描述即可创建、管理和分享 AI 智能体(AI Agents)的新工具,通过自动化实现简化工作流程。支持智能任...发现资讯6个月前06520
Seedream 4.5 – 字节跳动推出的AI图像创作模型,增强画面的立体感、光影效果字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在图像生成主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了的整体质量与稳定性。面向广告...发现资讯6个月前06520