2023 年两院院士增选结果正式揭晓， 45 岁颜宁新当选中国科学院院士，还有哪些信息值得关注？

万别千差网

发布时间：2024-07-05 13:47:21

阿里巴巴开源项目DreamTalk，能让人物头像栩栩如生地说话，支持多语言、歌曲、嘈杂音频匹配，开放更多开发者创新。

用户只需在通义千问APP内输入“通义舞王”或“全民舞王”等口令，然后按照提示要求上传自己的照片。系统会在十几分钟内生成一个神形兼备的舞蹈视频，保留原形象的面部表情、身材比例、服装以及背景等特征。

LLaVA是一个端到端训练的多模态大模型，它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合，具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型，拥有110亿个视觉参数和70亿个语言参数。

这也是该机构有史以来，对企业开出的最高罚单。