影像方面,后置1200万超广角+5000万广角+1000万长焦镜头,前置1200万像素镜头。
【AiBase提要:】据悉,M2UGen采用了创新的方法,生成了大规模的多模态音乐指导数据集,用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型,以在各个领域生成对应的指导。
体验地址:https://top.aibase.com/tool/shipinfanyipeiyin
然而,人类影响者认为虚拟同行应该透露他们不是真实的。内容创作者Danae Mercer说:“这些影响者让我害怕的是,很难辨别他们是假的。”