深度学习自然语言处理基础知识
- NLP前置基础(图论)
-
- 无向图
- 有向图
- 连通图
- 树
NLP前置基础(图论)
无向图
无向图 G可以定义为一个二元组G=(N,E),其中,N是顶点的非空有限集合;E是边的有限集合。
G=(N,E)
N={V1,V2,V3,V4,V5,V6}
E={(V1,V2),(V1,V3),(V1,V4),(V2,V5),(V3,V4),(V3,V5),(V3,V6),(V4,V6),(V5,V6)}
有向图
有向图 D可以定义为一个二元组D=(N,E),其中,N是顶点的非空有限集合,E是边的有限集合。
D=(N,E)
N={V1,V2,V3,V4,V5,V6}
E={(V1,V2),(V1,V5),…,(V5,V3),(V5,V6)}
连通图
连通图是一个无向图G=(N,E)或有向图D=(N,E),对于N中的任意两个顶点,存在一个顶点的序列 P,(肉眼可见的连接),则P也被称为图G或D的一条路径或者通路。
-回路
开始与终结于同一顶点的通路称为回路(自回路)(非频繁的);若图中无任何回路,则称该图为无回路图。
树
-树:一个无回路的无向图称为森林;一个无回路的连通无向图称为树(自由树)。
如果树中有一个结点被特别地标记为根节点,那么这棵树称为根树。
-树是包含n个节点的有穷集合S(n>0),且在S上定义了一个关系R,R满足以下三个条件:
(1)有且仅有一个结点t₀∈S,该结点对于R来说没有前驱,结点t₀称作树根;
(2)除了结点t₀以外,S中的每个结点对于R来说,都有且仅有一个直接前驱;
(3)除了结点以外的任何结点t∈S,都存在一个结点序列t₀,t₁,…,tk,使得t₀为树的根,tk=t,有序对<ti-1,ti>∈R(1≤i≤k),则该结点序列称为从根节点t₀到结点t的一条路径。
-在根树中,自上而下的路径末端结点称为树的叶结点,介于根节点与叶结点之间的结点称为中间结点(或称内结点)。