欢迎您光临本小站。希望您在这里可以找到自己想要的信息。。。

搜索算法总结

数据结构算法 water 2632℃ 0评论

1.跳跃表

2.FST+FSM

Finite StateTransducers 简称 FST,通常中文译作有穷状态转换器或者有限状态传感器,我更偏向于后者,因为后者更加贴近原意。FST目前在语音识别和自然语言搜索、处理等方向被广泛应用。FST的功能更类似于字典,Lucene4.0在查找Term时使用了FST算法,用来快速定位Term的位置。FST的数据结构可以理解成(key,value)的形式。

有限状态机,也称为FSM(Finite State Machine),其在任意时刻都处于有限状态集合中的某一状态。当其获得一个输入字符时,将从当前状态转换到另一个状态,或者仍然保持在当前状态。任何一个FSM都可以用状态转换图来描述,图中的节点表示FSM中的一个状态,有向加权边表示输入字符时状态的变化。如果图中不存在与当前状态与输入字符对应的有向边,则FSM将进入“消亡状态(Doom State)”,此后FSM将一直保持“消亡状态”。状态转换图中还有两个特殊状态:状态1称为“起始状态”,表示FSM的初始状态。状态6称为“结束状态”,表示成功识别了所输入的字符序列。在启动一个FSM时,首先必须将FSM置于“起始状态”,然后输入一系列字符,最终,FSM会到达“结束状态”或者“消亡状态”。

3.    双数组TrieTree

4.    优先级队列

5.    BitMap

6.    数据压缩

7.    B+ tree

8    HASH算法

9.   正排序、列存储

10. 倒排表解析(排序、过滤)

11. ES数据聚合(图)

12. 分布式算法

转载请注明:学时网 » 搜索算法总结

喜欢 (0)or分享 (0)

您必须 登录 才能发表评论!