
PaLM 2
Meta 的 LLaMA 系列模型。谷歌于 2022 年 4 月首次宣布推出 PaLM,超过了5400亿个训练参数。与其他 LLM 一样,PaLM 是一个灵活的系统,可以执行各种文本生成和编辑任务。例如,你可以将 PaLM 训练成像 ChatGPT 这样的对话式聊天机器人,或者你可以将它用于诸如总结文本甚至编写代码等任务。(这类似于谷歌今天也为其 Workspace 应用程序(如 Google Docs 和 Gmail)宣布的功能。)
主要功能:
通用模型:字节跳动自研LLM模型,支持128K长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景。
视频生成:通过精准语义理解、强大动态及运镜能力创作高质量视频,支持文本和图片生成两种模式。
角色扮演:创作个性化角色,具备上下文感知和剧情推动能力,适合虚拟互动和故事创作。
语音合成:生成自然生动的语音,能表达多种情绪,适用于文本到语音转换。
声音复刻:快速克隆声音,高度还原音色和自然度,支持跨语种迁移,用于个性化语音合成。
语音识别:准确识别和转录语音,支持多语种,适用于语音命令和转录服务。
文生图:将文本转换为图像,擅长图文匹配和中国文化元素创作,用于图像生成和视觉内容创作。
图生图:基于现有图像生成新图像,支持风格变换、扩图、重绘和涂抹等创意操作。
同声传译:提供超低延时且自然高质量的实时翻译,支持跨语言同音色翻译,打破沟通中的语言壁垒。
Function Call:准确识别和抽取功能参数,适合复杂工具调用和智能交互。
向量化:提供向量检索能力,支持LLM知识库的核心理解,适用于多语言处理。