Definition
目的是在海量语料库/文章中发现固定窗口(如5词以内、一句话内甚至一段内)单词a和单词b共同出现的频率,并以此构建单词共现矩阵。(矩阵可对称也可不对称(强调顺序),取决于具体应用).
二级排序的目的是实现key-value对对键排序之后继续按值排序的功能.
key
对应的所有value
放到一个Array
或List
中,再排序),因此可能会出现数据量过大,Reducer内存溢出的情况.MapReduce
程序中,Mapper输出的键值对会经过shuffle
过程再交给Reducer,在 shuffle 阶段,Mapper 输出的键值对会经过 partition(分区)->sort(排序)->group(分组)
三个阶段,在MapReduce中可以通过重写sort
来实现,因此只需要对key的格式进行修改,加入需要二级考虑的值并修改key类的compareTo
或Comparator class
即可.利用MapReduce并行化实现选择、投影、并、交、差及自然连接的关系代数操作。
记录完美解决虚拟机安装VM tools之后仅能实现屏幕自适应,无法进行物理机和虚拟机之间复制粘贴+文件拖拽功能的方法。
方法的重写(Overriding)和重载(Overloading)是java多态性的不同表现,重写是父类与子类之间多态性的一种表现,重载可以理解成多态的具体表现形式。
1.节点的度:
树的度是各节点度的最大值
节点的度是节点拥有的子树个数
树中的叶子结点的个数计算方法:
若一棵度为4的树中度为1、2、3、4的节点的个数分别为4、3、2、2,则该树叶子节点的个数是多少?总节点个数是多少?
设树T中的结点个数为n,度为0的结点的个数为n0,度为1的结点的个数为n1,度为2的结点的个数为n2,度为3的结点的个数为n3,度为4的结点的个数为n4,则有:
n = n0 + n1 + n2 + n3 + n4
设树T中的总边数为e,则该树节点的总入度 = 总出度 = 总边数
因为除了根节点的入度为0,其余各节点的入度都为1,则有:
e = n0 + n1 + n2 + n3 + n4 - 1
又因为,n0的出度为0,n1的出度为1,n2的出度为2,n3的出度为3,n4的出度为4,所以:
e = n0 * 0 + n1 * 1+ n2 * 2 + n3 * 3 + n4 * 4
代入即可得n0的值.
2. 树的深度: 树的层数