新物网

当前位置:首页 > 财商

财商

苹果展示 AI 新模型 MGIE,可一句话精修图片

时间:2024-02-08 09:04:49 小新新
苹果公司发布了名为 MGIE 的开源人工智能模型,能根据自然语言指令编辑图像。MGIE 利用多模态大型语言模型 MLLM 解释用户指令并执行像素级操作,能进行

苹果公司发布了名为 MGIE 的开源人工智能模型,能根据自然语言指令编辑图像。MGIE 利用多模态大型语言模型 MLLM 解释用户指令并执行像素级操作,能进行 Photoshop 风格的修改、全局照片优化和局部编辑等操作。

MGIE 将 MLLMs 集成到图像编辑过程中,通过推导出富有表现力的指令和生成视觉想象力来实现编辑。该模型可以处理各种编辑情况,并可以根据用户偏好执行全局和局部编辑。

MGIE 是一个开源项目,用户可以在 GitHub 上找到代码、数据和预训练模型,并提供了一个演示笔记本展示如何使用 MGIE 完成各种编辑任务。