基于語(yǔ)義塊識(shí)別的材料科學(xué)文獻(xiàn)工藝數(shù)據(jù)實(shí)體關(guān)系抽取
打開(kāi)文本圖片集
DOI:10.20030/j.cnki.1000?3932.202403020
摘 要 提出一種語(yǔ)義塊標(biāo)注的材料科學(xué)文獻(xiàn)工藝實(shí)體關(guān)系抽取方案和基于多步實(shí)體識(shí)別的流水線式材料科學(xué)文獻(xiàn)工藝實(shí)體關(guān)系抽取模型。針對(duì)材料科學(xué)文獻(xiàn)中工藝數(shù)據(jù)的語(yǔ)義邏輯塊通常連續(xù)出現(xiàn)的特點(diǎn),首先采用語(yǔ)義塊標(biāo)注方案將工藝文本作為一個(gè)序列完整地進(jìn)行命名實(shí)體識(shí)別,然后將提取出的工藝數(shù)據(jù)序列單獨(dú)進(jìn)行分類和進(jìn)一步命名實(shí)體識(shí)別,最后依據(jù)類型分類結(jié)果和實(shí)體識(shí)別結(jié)果對(duì)工藝操作與條件參數(shù)構(gòu)建關(guān)系三元組。(剩余15577字)