٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智本土
阿里通义大模型家族再添新成员,Qwen2系列新增音频语言模型Qwen2-Audio,可直接进行语音问答。通义团队还发布了新的音频理解模型测评基准,相关研究已入选ACL 2024国际会议。
阿里通义大模型推出Qwen2-Audio,实现无文本语音问答功能
视频创作
Spikes Studio是一款专为内容创作者设计的AI视频剪辑工具,可将长视频转化为适合YouTube、Twitch、TikTok和Instagram Reels等平台的短视频。该工具具备自动生成字幕、标题、标签等功能,大幅简化视频编辑过程。
Spikes Studio:探索Spikes AI在社交媒体视频剪辑中的创新应用
开源创新
AutoStudio,一个无训练多代理框架。它利用基于大型语言模型(LLMs)和稳定扩散(Stable Diffusion, SD)的代理,能够在多个回合的用户互动中生成连贯且多样的图像。
AutoStudio AI:联想研究院与中山大学团队推出创新多回合交互图像生成框架
数智国际
在纽约峰会上,亚马逊云科技发布了由生成式AI驱动的Amazon App Studio,助力用户通过自然语言快速创建企业级应用程序。预览版现已在美国西部区域上线。
亚马逊云科技推出Amazon App Studio,简化企业级应用开发
开源创新
阿里巴巴集团旗下的通义实验室通过其FunAudioLLM项目,致力于提升人与大型语言模型(LLMs)之间的自然语音交互体验。FunAudioLLM由两大核心模型组成:SenseVoice和CosyVoice,分别专注于语音理解和语音生成,为多种应用场景提供强大的技术支持。
FunAudioLLM:阿里巴巴通义实验室的SenseVoice与CosyVoice引领语音技术新潮流
数智本土
虹软PhotoStudio AI(PSAI)近日入驻抖店服务市场,为电商提供AI图像生成及商品图优化服务,显著提高商品展示效率,降低拍摄成本。此外,PSAI的AIGC视频生成功能也在阿里1688平台上线,为商家提供新的营销工具,进一步提升商品竞争力和品牌影响力。
虹软PhotoStudio AI入驻抖店市场,助力电商高效图像生成
开源创新
AudioSeal是一种专为自然或合成语音嵌入水印而设计的技术,能够在经过各种音频编辑后检测这些水印。AudioSeal的主要组件包括一个用于嵌入水印的生成器和一个用于检测水印的检测器。其卓越的鲁棒性和检测速度使其在大规模和实时应用中尤为适用。
Meta出品的AudioSeal:检测和保护AI生成语音的本地水印技术
音乐创作
Udio的AI音乐生成平台,用户只需输入简单的文本描述,AI即可根据这些描述创作出风格多样的音乐。无论是流行、爵士、电子音乐还是古典音乐,Udio的智能系统都能够捕捉用户的创意意图,并转化为高质量的音乐作品。
Udio AI音乐生成器:将文本描述转化为独特音乐体验
视频创作
Wonder Studio,由Wonder Dynamics开发,是一个突破性的AI平台,旨在为电影和电视制作人提供前所未有的视觉效果(VFX)创作能力。
Wonder Studio:革新电影制作的AI工具
数智国际
Stability AI最近发布了其音频生成模型Stable Audio的升级版2.0,此版本带来了革命性的变化,包括允许用户上传自己的音频样本并创造个性化AI生成歌曲的能力。
Stability AI推出Stable Audio 2.0
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.