Skip to content

Commit

Permalink
Update README
Browse files Browse the repository at this point in the history
  • Loading branch information
ZeyuChen committed May 16, 2022
1 parent 6f378fd commit 5528ec4
Showing 1 changed file with 21 additions and 33 deletions.
54 changes: 21 additions & 33 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -16,26 +16,22 @@
![GitHub](https://img.shields.io/github/license/paddlepaddle/paddlenlp)

<h4 align="left">




<a href=#特性> 特性 </a> |
<a href=#安装> 安装 </a> |
<a href=#QuickStart> QuickStart </a> |
<a href=#QuickStart> Quick Start </a> |
<a href=#API文档> API文档 </a> |
<a href=#社区交流> 社区交流 </a>
</h4>

## News <img src="./docs/imgs/news_icon.png" width="40"/>

* 🔥 2021.5.18-19直播课,解读信息抽取UIE和ERNIE 3.0轻量级模型能力,欢迎报名来交流
* 🔥 2021.5.18-19直播课,解读通用信息抽取技术UIE和ERNIE 3.0轻量级模型能力,欢迎报名来交流

<div align="center">
<img src="https://user-images.githubusercontent.com/11793384/168411900-d9f3d777-99ab-4b5c-8cdc-ef747a48b864.jpg" width="188" height="188" />
</div>

* 🔥 2022.5.16 PaddleNLP [release/2.3](https://github.com/PaddlePaddle/PaddleNLP/releases/tag/v2.3.0rc0)
* 🔥 2022.5.16 PaddleNLP [release/2.3](https://github.com/PaddlePaddle/PaddleNLP/releases/tag/v2.3.0)

* 新增文心大模型 [ERNIE 3.0](./model_zoo/ernie-3.0),在CLUE Benchmark上实现同规模模型中文最佳效果;新增中文医疗领域预训练模型 [ERNIE-Health](./model_zoo/ernie-health);新增超大规模百亿(11B)开放域对话预训练模型 PLATO-XL(英文),并提供FasterGeneration高性能GPU加速,相比上版本推理速度加速2.7倍。
* 通用信息抽取技术 [UIE](./model_zoo/uie)发布,单个模型可以同时支持命名实体识别、关系抽取、事件抽取、情感分析等任务;
Expand All @@ -48,13 +44,13 @@

PaddleNLP是飞桨自然语言处理开发库,旨在提升开发者在文本领域的开发效率,并提供丰富的NLP应用示例。具备以下四大特性:

- <img src="https://user-images.githubusercontent.com/11793384/168454776-2075cc68-9402-4b0b-8723-5be0a315ddc3.png" width="18" height="18" /><a href=#开箱即用的一键预测能力> 开箱即用的一键预测能力 </a>
### <img src="https://user-images.githubusercontent.com/11793384/168454776-2075cc68-9402-4b0b-8723-5be0a315ddc3.png" width="18" height="18" /><a href=#开箱即用的一键预测能力> 开箱即用的一键预测能力 </a>

- <img src="https://user-images.githubusercontent.com/11793384/168454751-f111d8b4-a16a-4e36-b9de-3af8a2f00714.png" width="18" height="18" /><a href=#优质的中文预训练模型库> 优质的中文预训练模型库 </a>
### <img src="https://user-images.githubusercontent.com/11793384/168454751-f111d8b4-a16a-4e36-b9de-3af8a2f00714.png" width="18" height="18" /><a href=#优质的中文预训练模型库> 优质的中文预训练模型库 </a>

- <img src="https://user-images.githubusercontent.com/11793384/168454721-0ac49e17-22db-4074-ba20-940365daf9f6.png" width="18" height="18" /><a href=#产业级端到端系统范例> 产业级端到端系统范例 </a>
### <img src="https://user-images.githubusercontent.com/11793384/168454721-0ac49e17-22db-4074-ba20-940365daf9f6.png" width="18" height="18" /><a href=#产业级端到端系统范例> 产业级端到端系统范例 </a>

- <img src="https://user-images.githubusercontent.com/11793384/168454587-8b5a0f63-3d4b-4339-be47-f3ad7ef9e16c.png" width="18" height="21" /><a href=#大规模分布式训练与高性能推理能力> 大规模分布式训练与高性能推理能力 </a>
### <img src="https://user-images.githubusercontent.com/11793384/168454587-8b5a0f63-3d4b-4339-be47-f3ad7ef9e16c.png" width="18" height="21" /><a href=#大规模分布式训练与高性能推理> 大规模分布式训练与高性能推理 </a>


### 开箱即用的一键预测能力
Expand All @@ -67,9 +63,9 @@ Taskflow旨在提供**开箱即用**的产业级NLP预置任务能力,覆盖

### 优质的中文预训练模型库

- **Transformer 预训练模型**
#### 丰富的Transformer预训练模型

精选 **45+** 个网络结构和 **500+** 个预训练模型参数,⭐️⭐️ 国内下载速度快!⭐️⭐️ 既包括百度自研的预训练模型如ERNIE系列, PLATO, SKEP等,也涵盖业界主流的中文预训练模型如BERT,GPTRoBERTa,T5等。使用`paddlenlp.transformers.AutoModel`可以下载不同网络结构的预训练模型:
精选 45+ 个网络结构和 500+ 个预训练模型参数,既包括文心NLP大模型的ERNIE、PLATO等,也涵盖业界主流BERT、GPTRoBERTa、T5等结构。通过AutoModel API一键实现⚡高速下载⚡。

```python
from paddlenlp.transformers import *
Expand All @@ -84,9 +80,6 @@ gpt = AutoModelForPretraining.from_pretrained('gpt-cpm-large-cn')

<details><summary>&emsp;对预训练模型应用范式如语义表示、文本分类、句对匹配、序列标注、问答等,提供统一的API体验(可展开详情)</summary><div>




```python
import paddle
from paddlenlp.transformers import *
Expand All @@ -109,9 +102,6 @@ model = AutoModelForQuestionAnswering.from_pretrained('ernie-3.0-medium-zh')

<details><summary>&emsp;PaddleNLP预训练模型适用任务汇总(可展开详情)</summary><div>




| Model | Sequence Classification | Token Classification | Question Answering | Text Generation | Multiple Choice |
| :----------------- | ----------------------- | -------------------- | ------------------ | --------------- | --------------- |
| ALBERT ||||||
Expand Down Expand Up @@ -159,11 +149,11 @@ model = AutoModelForQuestionAnswering.from_pretrained('ernie-3.0-medium-zh')

可参考[Transformer 文档](/docs/model_zoo/index.rst) 查看目前支持的预训练模型结构、参数和详细用法。

- **模型应用示例,覆盖NLP全场景**
#### 覆盖NLP全场景的应用示例

覆盖从学术到产业级的NLP[应用示例](#多场景的应用示例),涵盖NLP基础技术、NLP系统应用以及相关拓展应用。全面基于飞桨核心框架2.0全新API体系开发,为开发者提供飞桨文本领域的最佳实践。

精选预训练模型示例可参考[Model_Zoo](./model_zoo)
精选预训练模型示例可参考[Model Zoo](./model_zoo)

更多场景示例文档可参考[examples目录](./examples)[Notbook交互式教程](https://aistudio.baidu.com/aistudio/personalcenter/thirdview/574995)

Expand All @@ -172,7 +162,7 @@ model = AutoModelForQuestionAnswering.from_pretrained('ernie-3.0-medium-zh')

PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推出场景系统技术方案,打通数据标注-模型训练-调优-预测部署全流程。

- **智能语音指令解析**
#### 智能语音指令解析

集成了业界领先的语音识别(Automatic Speech Recognition, ASR)、信息抽取(Information Extraction, IE)等技术,打造智能一体化的语音指令系统,广泛应用于智能语音填单、智能语音交互、智能语音检索、手机APP语音唤醒等场景,提高人机交互效率。

Expand All @@ -181,10 +171,9 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推
</div>



更多可参考[智能语音指令解析](./applications/speech_cmd_analysis)

- **语义检索系统**
#### 语义检索系统

针对无监督数据、有监督数据等多种数据情况,结合SimCSE、In-batch Negatives、ERNIE-Gram单塔模型等,推出前沿的语义检索方案,包含召回、排序环节,打通训练、调优、高效向量检索引擎建库和查询全流程。

Expand All @@ -195,7 +184,7 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推

更多可参考[语义检索系统](./applications/neural_search)

- **智能问答系统**
#### 智能问答系统

推出基于语义检索技术的问答系统,支持FAQ问答、说明书问答等多种业务场景。

Expand All @@ -208,7 +197,7 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推
更多可参考[智能问答系统](./applications/question_answering)


- **评论观点抽取与情感分析**
#### 评论观点抽取与情感分析

基于情感知识增强预训练模型SKEP,针对产品评论进行评价维度和观点抽取,以及细粒度的情感分析。

Expand All @@ -219,18 +208,18 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推

更多可参考[情感分析](./applications/sentiment_analysis)

### 大规模分布式训练与高性能推理能力
### 大规模分布式训练与高性能推理

- **飞桨4D混合并行分布式训练**
#### 飞桨4D混合并行训练

<div align="center">
<img src="https://user-images.githubusercontent.com/11793384/168515134-513f13e0-9902-40ef-98fa-528271dcccda.png" height="400" width="500">
</div>


更多技术细节可参考[GPT-3](./examples/language_model/gpt-3)
更多关于千亿模型分布式训练细节可参考[GPT-3](./examples/language_model/gpt-3)

- **高性能Transformer类文本分词器:FasterTokenizer**
#### 高性能文本处理库 FasterTokenizers

<div align="center">
<img src="https://user-images.githubusercontent.com/11793384/168407921-b4395b1d-44bd-41a0-8c58-923ba2b703ef.png" width="500">
Expand All @@ -239,14 +228,14 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推

更多内容可参考[FasterTokenizer文档](./faster_tokenizers)

- **面向生成任务的高性能加速组件:FasterGeneration**
#### 高性能生成加速组件 FasterGeneration

<div align="center">
<img src="https://user-images.githubusercontent.com/11793384/168407831-914dced0-3a5a-40b8-8a65-ec82bf13e53c.gif" width="500">
</div>


更多内容可参考[FasterGeneration文档](./examples/faster/faster_generation)
更多内容可参考[FasterGeneration文档](./faster_generation)

## 社区交流👬

Expand All @@ -259,7 +248,6 @@ PaddleNLP针对信息抽取、语义检索、问答、情感倾向分析,推
</div>



## 安装

### 环境依赖
Expand Down

0 comments on commit 5528ec4

Please sign in to comment.