我有一个观点:
所有通过AI一句话几十秒做出来的PPT,
都是不值一听的!
AI生成PPT,
应该从框架或者内容开始。
演讲者先想好要讲些什么,
再让AI去做细化和美化,
而不是让它全权决定该讲些什么。
一键生成PPT是如何实现的?
我对AI很感兴趣,
也做过PPT工具HEIP,
因此对智能PPT工具一直在关注。
PPT一键生成分为内容和设计两个步骤。
毫不夸张地说,
目前所有工具的的设计步骤,
和生成式AI没有任何关系。
全部是套用预设模板,
再根据内容调一下颜色、尺寸、大小等细微参数,
这其实对于PPT来说也够用了。
从内容来看,
智能PPT类型有3种。
第1种是基于格式规范的生成,
它的内容来自对原始对象格式的识别,
例如文本的长短,
图片的长宽等等,
HEIP就是这样一款工具,
它不会增删原始对象,
只会进行识别、判断和排版。
第2种是基于主题的生成,
它的内容来自于大模型,
由一句简短的提示语言扩充得到,
现在绝大多数的AI PPT用的是这样的方法。
调取大模型接口输入固定的提示语即可实现。
第3种是分析内容的生成,
它需要训练或者灵活调用大模型去分析原始对象,
然后采用扩充、精简、强调和调整等等手段,
得到适应PPT表达方式的内容。
这个就要困难很多。
变革性的Gamma
Gamma是一款去年就出现的智能PPT工具,
在近期更新之后,
我认为它终于带来了变革性的发展:
——分析文本,让其变得适合PPT演示。
它支持上传分页的原始PPT进行设计。
得到的结果如下,
先大致感受一下。
再来看一份文件,
这是我以前招PPT美化设计师用的题目。
这次细致地从内容和设计两个角度看看。
第一页内容上进行了扩充,
但文字的逻辑层级判断不太对,
设计上加强了元素的对齐和对比,
整体感觉略有提升。
第二页内容上没有变化,
设计上用表格的方式调整了目录。
第三页看起来就不行了,
内容本身逻辑比较复杂,
生成稿没有体现出来,
设计上只是分栏列出了文字内容。
第四页内容上进行了小标题归纳,
设计上提升明显,
三个层级的文字有对比的美感,
还加入了引导性编号,
看来它最擅长处理这类单段的纯文本内容。
整体来说,
AI对于统一设计风格也很有效。
除了分页框架内容之外,
用文章生成PPT也是一种常用的需求。
导入文章之后,
Gamma支持对内容进行自动拆分。
来看看生成的成果,
我感觉还挺不错的,
稍微改改就能用起来了。
Gamma的缺点
说了优点,
再来说说Gamma目前的缺点。
第一,只会提取文本
不会提取原始PPT或者Word里的多媒体资源,
例如我放一张团队的图片。
它生成之后就变成了单人图片。
建议大家目前使用纯文本进行生成。
未来,
这类工具必然需要进化到能够识别多媒体。
第二,它会强制配图
目的是为了页面漂亮元素丰富,
配的是AI绘制的图,
但这种图一般都是意义性不强的,
而且容易出错。
例如原本有精确数字的表。
变为了完全不能用的AI图。
建议将这些图片作为占位符对待,
调整大小或者删除,
它可以从窄图扩展到占页面的50%,
文字会随之变化大小和位置,
导出PPT之后,
插入你自己的图或者表。
未来,
这类工具应该可以强制保留自己的图表,
而不用AI重绘。
第三,版式较少
基本上都是左右分开的单图加文字排版,
偶尔有上下分开的单图加文字排版。
未来,
随着多媒体识别的实现,
有可能会出现更多的版式。
演示文稿的制作方式将被完全改变
在生成式人工智能飞速发展的这两年,
站着这个时间节点上看智能PPT生成工具:
设计上的自动匹配模板技术已经成熟。
虽然没有用到生成式AI,
但已足够智能PPT使用。
甚至我认为先有模板再填充内容,
只给予小范围的设计调整,
是比通过大模型设计PPT更靠谱的方式。
因为它便捷、可控且具有设计上的统一性。
内容上主要依赖大模型,
除了应用大模型将主题扩充为完整内容外,
已初步实现分析原始素材并调整到适合PPT演示。
这一点是智能PPT的任督二脉,
一旦打通就是境界提升。
不远的未来,
演示文稿的制作方式,
将彻底被改变。
在美与实用间寻找平衡
黑白间设计