Supertonic – 开源的AI文本转语音系统,最快的TTS系统,实现零延迟响应Supertonic开源了AI端侧离线文本转语音系统,支持本地高性能语音合成,无需云端依赖,确保隐私和零延迟。Supertonic 具有高度可配置性,用户可根据需求调整推理步骤、批量处理等参数,并支持...发现5个月前08890
Klear-Reasoner – 快手开源的8B推理模型,专注于提升数学和代码推理能力Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创...发现资讯9个月前08890
Paper2Video – 国立大学推出的学术论文生成演示视频项目,自动生成演示视频Paper2Poster是一款开源的多模态智能系统,支持本地部署以及 API 接入,并将生成可编辑的 .pptx 海报文件,在产出成果的基础上引入 PaperQuiz 来对传达效果进行量评。给它一篇论...发现资讯7个月前08880
Emu3.5 – 智源研究院推出的多模态世界大模型,速度提升了近20倍智源研究院正式发布了“悟界 EMU3.5”多模态世界大模型,标志着人工智能从“语言学习”向“多模态世界学习”演进的新纪元。Emu3.5 在图像生成和编辑任务上取得了与Gemini 2.5 Flash ...发现资讯6个月前08860
deepfig-多模态交互新体验,语音+视觉融合技术重构客户服务在数字化时代,客户服务的模式正在不断演变。随着人工智能技术的快速发展,尤其是语音识别和计算机视觉的进步,DeepFig语音+视觉融合技术应运而生,为客户服务领域带来了全新的多模态交互体验。 一、Dee...发现科技10个月前08840
HeyGen一在线视频创作平台HeyGen是一个在线视频创作平台,专注于利用人工智能技术生成数字人视频。它利用生工智能的力量来简化您的视频创作过程。用HeyGen释放你的创造力-视频制作的未来。HeyGen支持40多种语言和不同的...发现资讯8个月前08830
八爪鱼RPA是一款基于机器人流程自动化平台八爪鱼RPA是一款基于机器人流程自动化(Robotic Process Automation, RPA)技术的办公流程自动化工具,旨在通过模拟人类操作,如鼠标点击、键盘输入、数据读取等,实现自动化任务...发现资讯7个月前08770
deepfig一款创新的工具,设计师得力助手,将创意落地时间从3天缩短至4小时,Deepfig是一款创新的工具,旨在将创意落地的时间从3天缩短至4小时。它通过一系列高效的功能和先进的技术原理,帮助用户快速实现创意的可视化与执行。 功能介绍 自动化创意生成 Deepfig利用深度学...发现科技10个月前08750
混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍在2025腾讯全球数字生态大会上,腾讯混元3D 3.0模型正式发布,混元3D 3.0模型现已集成于混元3D AI创作引擎,面向用户免费开放,并同步上线腾讯云API。混元3D 3.0模型建模精度比上一版...发现资讯8个月前08730
百度最新推出的AI语言大模型–文心 5.0 Preview ,精准执行复杂指令百度宣布文心大模型5.0-Preview在LMArena文本排行榜上排名全球第二、国内第一,超越GPT-5-High等主流模型。模型在创意写作、复杂长问题理解和指令遵循等任务中表现出色,能高效生成高质...发现6个月前08700