• 熱門行業(yè)
  • 裝修建材
  • 家居生活
  • 餐飲食品
  • 母嬰教育
  • 電腦辦公
  • 服裝首飾
  • 汽車工具
  • 家電數(shù)碼
  • 機械化工
  • 休閑美容
返回上一頁
專利狀態(tài)
一種基于命名實體識別的中文標(biāo)點符號添加方法
有效
專利申請進(jìn)度
申請
2020-06-01
申請公布
2020-09-25
授權(quán)
2024-02-02
預(yù)估到期
2040-06-01
專利基礎(chǔ)信息
申請?zhí)?/td> CN202010485752.7 申請日 2020-06-01
申請公布號 CN111709242A 申請公布日 2020-09-25
授權(quán)公布號 CN111709242B 授權(quán)公告日 2024-02-02
分類號 G06F40/295;G06F40/10;G06N3/0442;G06N3/045;G06N3/047;G06F16/903
分類 計算;推算;計數(shù);
申請人名稱 廣州多益網(wǎng)絡(luò)股份有限公司
申請人地址 廣東省廣州市蘿崗區(qū)伴河路90號自編一棟301房
專利法律狀態(tài)
  • 2024-02-02
    授權(quán)
    狀態(tài)信息
    授權(quán)
  • 2020-09-25
    公布
    狀態(tài)信息
    公布
摘要
本發(fā)明公開了一種基于命名實體識別的快速中文標(biāo)點符號添加方法,主要包括:收集并清洗文本數(shù)據(jù),以命名實體識別任務(wù)形式為標(biāo)點符號添加模型構(gòu)造生成訓(xùn)練數(shù)據(jù)集;用雙向LSTM或者雙向GRU網(wǎng)絡(luò)加條件隨機場的組合,構(gòu)建輕量級的網(wǎng)絡(luò)模型;利用訓(xùn)練數(shù)據(jù)集來訓(xùn)練神經(jīng)網(wǎng)絡(luò);利用訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型對無標(biāo)簽文本進(jìn)行實體識別,根據(jù)識別到的實體類別在實體后添加實體所屬類別的標(biāo)點符號。本發(fā)明通過構(gòu)建輕量級的神經(jīng)網(wǎng)絡(luò)模型來對無標(biāo)點符號文本進(jìn)行中文標(biāo)點符號的添加,可以快速地根據(jù)句中語義與語法,為無標(biāo)點符號文本添加上四種常用的標(biāo)點符號,便于讀者閱讀文本時快速理解語義。所用的網(wǎng)絡(luò)結(jié)構(gòu)輕,訓(xùn)練與推理速度快,且不需要大量的訓(xùn)練數(shù)據(jù)。