机器之心专栏
机器之心编辑部
AI作画在全世界越来越盛行。近日,百度发布知识增强跨模态大模型——ERNIE-ViLG2.0,在AI作画领域取得新突破。该模型采用基于知识增强算法的混合降噪专家建模,是全球首个知识增强的AI作画大模型,也是目前全球参数规模最大的AI作画大模型。
据了解,ERNIE-ViLG2.0在文本生成图像公开权威评测集MS-COCO和人工盲评上均超越了StableDiffusion、DALL-E2等模型,取得了当前该领域的世界最好效果,在语义可控性、图像清晰度、中国文化理解等方面均展现出了显著优势。
论文链接: