Keras 3.0正式发布 引入全新的大模型训练和部署功能
要点:
经过5个月的更新迭代,Keras3.0全面支持TensorFlow、JAX和PyTorch,实现了对Keras的完全重写。
Keras3.0的API可用于JAX、TensorFlow和PyTorch,支持跨框架的数据pipeline,使用户可以选择最适合其目标的框架。
Keras3.0引入了新的大模型训练和部署功能,支持各种预训练模型,并高度向后兼容Keras2.0,用户可以平滑过渡。
11月29日 消息:Keras3.0的发布标志着一次重大的更新迭代,经过5个月的努力,该版本在多个方面带来了显著的改进。首先,Keras3.0全面支持了TensorFlow、JAX和PyTorch框架,这意味着用户现在可以选择在不同框架上运行他们的Keras工作流。这种灵活性为开发者提供了更多选择,根据具体需求轻松切换框架成为可能。
不仅如此,Keras3.0还进行了全面的重写,引入了全新的大模型训练和部署功能。用户可以在新版本中利用各种预训练模型,包括在后端中使用的40个Keras应用模型,以及KerasCV和KerasNLP中的大量预训练模型。这为开发者提供了更多强大的工具,有助于构建更复杂、性能更优越的深度学习模型。
地址:https://keras.io/keras_3/
Keras3.0的另一个亮点是其高度向后兼容性。通过实现Keras2的公共API接口,Keras3.0使得大多数用户无需更改任何代码即可在新版本上运行之前的Keras脚本。这一特性确保了平稳的过渡,使得那些对新版本不太熟悉或暂时不想升级的用户可以继续使用之前的版本。
关于框架的选择,Keras3.0支持所有后端的跨框架数据pipeline,包括tf.data.Dataset pipelines、torch.utils.data.DataLoader对象、NumPy数组和Pandas数据框、以及Keras的keras.utils.PyDataset对象。
这意味着用户可以使用各种数据pipeline进行训练,而不受具体框架的限制。而新推出的分布式API更是为解决多设备模型分片问题提供了解决方案,使得在大规模数据并行和模型并行方面更加高效。
综合来看,Keras3.0的发布不仅为深度学习开发者提供了更多选择和工具,还在多方面的性能和灵活性上有了显著提升,为未来的深度学习应用奠定了更加坚实的基础。