技术原理

按语义分块为例,它背后用到了自然语言处理(NLP)的技术,核心是语义相似度。具体过程是这样的:

  1. 先把文档初步切成小单元,比如句子或短段落。
  2. 用一个预训练的AI模型(比如Sentence-BERT)把每个单元转成一串数字( …
more