1) Double-array Trie
双数组Trie
1.
Research on Double-array Trie Based Fishery Segmentation;
基于双数组Trie树的渔业领域分词研究
2) Double-Array TRIE Dictionary
双数组TRIE词典
3) double-array
双数组
1.
URL access control algorithm based on double-array finite state machine;
基于双数组有限状态机的URL访问控制算法
2.
Research of Optimization on Double-Array Trie and its Application;
双数组Trie树算法优化及其应用研究
3.
A Study and Realization of Double-Array Based Segmentation Dictionary;
基于双数组的分词词典研究与实现
4) Trie-tree
Trie树
1.
Study on Chinese-English dictionary lookup mechanism based on combining Trie-tree with inverted index;
Trie树和单字倒排相结合的汉英词典查找机制
2.
A Jumping Table Trie-tree IP Classification Algorithm;
基于跳转表Trie树的IP分类算法
3.
In order to improve lookup efficiency,a novel IP classification,NHMT(non-collision Hash and nultibit-trie tree) is proposed, which is based on non-collision Hash trie-tree algorithm and grid of tries algorithm.
为了提高查找效率,在无冲突哈希查找算法和Grid of Tries算法的基础上提出了一种基于无冲突哈希和多比特Trie树(NHMT)的IP分类算法。
5) trie tree
Trie树
1.
After analyzing the binary-Trie tree, an algorithm of IP address classification bases on 256-branch search tree is introduced.
在分析二叉Trie树的基础上,改进了其结构,提出了基于256-叉查找树的IP地址分类算法,并详细介绍了其实现过程,比较了它们的优缺点。
2.
We improved the structure of Trie tree,a kind of ordered tree,to build a pinyin tree,and then implement the intelligent Chinese pinyin input under uCLinux.
本文采用改进的Trie树构造拼音生成树,在uClinux上实现了具有联想功能的汉字输入法。
6) Trie
Trie树
1.
Binary Search on Levels (BSOL) algorithm, which supports range and prefix rules, is a time efficient packet classification algorithm and can extend to multi-dimension packet classification easily while its performance is affected badly when the load factor of hash table is large or hash collision occurs frequently since the key structure is a hash table created by Trie tree in every layer.
改进后的折半层次搜索算法将为Trie树的每一层建立了一个布鲁姆过滤器,在进行hash查找之前先进行一次布鲁姆查询运算,能够保障在hash装载因子较大的情况下依然具有良好的性能。
补充资料:组蛋白和非组蛋白
组蛋白是存在于染色体内的与 DNA结合的碱性蛋白质,染色体中组蛋白以外的蛋白质成分称非组蛋白。绝大部分非组蛋白呈酸性,因此也称酸性蛋白质或剩余蛋白质。组蛋白于1834年由德国科学家A.科塞尔发现。
组蛋白对染色体的结构起重要的作用。染色体是由重复单位──核小体组成。 每一核小体包括一个核心8聚体(由 4种核心组蛋白H2A、H2B、H3和H4的各两个单体组成);长度约为200个碱基对的脱氧核糖核酸(DNA);和一个单体组蛋白H1。长度约为140个碱基对的DNA盘绕于核心8聚体外面。在核心8聚体之间则由长度约为60个碱基对的DNA连接。这种DNA称为"接头"DNA。
组蛋白的组分 几乎所有真核细胞染色体的组蛋白均可分成5种主要的组分,分别用字母或数字命名,命名方法也不统一,如H1或称F1,Ⅰ;H2A或称F2A2,Ⅱb1;H2B或称F2B,Ⅱb2;H3或称F3,Ⅲ;H4或称F2A1,Ⅳ。有核的红细胞或个别生物体中,还存在特别的组蛋白成分,红细胞中为H5或F2C,Ⅴ,鲑鱼组织中为H6或T。H2A、H2B、H3、H4组成核小体的核心,也称核心组蛋白。根据组蛋白的一级结构,又可将它们分为3种类型:赖氨酸含量特别丰富的组蛋白(H1);赖氨酸含量较丰富的组蛋白(H2A和H2B);精氨酸含量丰富的组蛋白(H3和H4)。从整体来说,组蛋白在进化过程中保守性很强。其中H1变化较大,H3和H4变化最小。如对小牛胸腺的5种组蛋白,豌豆苗组蛋白的H3、H4和兔胸腺组蛋白H1等的一级结构比较中发现,小牛胸腺和豌豆苗的组蛋白H4间只在60位和77位上的两个氨基酸残基不同。但已知的真菌和原生动物的组蛋白的部分一级结构和动、植物的组蛋白间的差异较大。
组蛋白合成后的修饰 这是形成组蛋白各组分微不均一性的主要原因。修饰的方式有:①乙酰化。有两种,一种是H1、H2A、H4 组蛋白的氨基末端乙酰化,形成α-乙酰丝氨酸,组蛋白在细胞质内合成后输入细胞核之前发生这一修饰。二是在H2A、H2B、H3、H4的氨基末端区域的某些专一位置形成 N6-乙酰赖氨酸。②磷酸化。所有组蛋白的组分均能磷酸化,在细胞分裂期间,H1的1~3个丝氨酸可以磷酸化。而在有丝分裂时期,H1有3~6个丝氨酸或苏氨酸发生磷酸化,其他四个核心组蛋白的磷酸化可以发生在氨基末端区域的丝氨酸残基上。组蛋白的磷酸化可能会改变组蛋白与 DNA的结合。③甲基化。仅发现于H3的 9和27位和H4的20位的赖氨酸,鸭红细胞组蛋白H1和H5的组氨酸。④ADP-核糖基化。组蛋白H1、H2A、H2B及H3和多聚ADP-核糖的共价结合,ADP-核糖基化被认为是在真核细胞内启动复制过程的扳机。
非组蛋白 染色质中一大群分子量5000~ 15000的蛋白质的总称。真核细胞的非组蛋白可能有 100种以上。由于非组蛋白本身具有聚合特性,它们和组蛋白、核酸等也有结合能力,用电泳和层析技术完全分离非组蛋白比较困难,用双向电泳技术曾在兔肝和诺维科夫肝癌细胞分别分离到69个和84个组分。非组蛋白大致包含下列三类蛋白质:①细胞核内大量的酶。包括 DNA合成及修复过程中的DNA多聚酶和连接酶,核糖核酸(RNA)聚合酶,以及核酸和蛋白质如组蛋白在修饰过程中所需要的酶;②在染色体中起结构作用的蛋白质;③其他尚未阐明功能的蛋白质。非组蛋白在各种组织和细胞的分化及发育过程中以及在正常细胞向肿瘤细胞的转化过程中均会发生变化。各种不同的动物和组织中的非组蛋白成分也有较大的变化。非组蛋白能够选择性地和同源 DNA 结合,它们在RNA聚合酶作用下在体外能促进DNA的转录,所以有人认为染色质中的具有专一功能的非组蛋白在基因转录的选择性调控上起重要作用。
组蛋白对染色体的结构起重要的作用。染色体是由重复单位──核小体组成。 每一核小体包括一个核心8聚体(由 4种核心组蛋白H2A、H2B、H3和H4的各两个单体组成);长度约为200个碱基对的脱氧核糖核酸(DNA);和一个单体组蛋白H1。长度约为140个碱基对的DNA盘绕于核心8聚体外面。在核心8聚体之间则由长度约为60个碱基对的DNA连接。这种DNA称为"接头"DNA。
组蛋白的组分 几乎所有真核细胞染色体的组蛋白均可分成5种主要的组分,分别用字母或数字命名,命名方法也不统一,如H1或称F1,Ⅰ;H2A或称F2A2,Ⅱb1;H2B或称F2B,Ⅱb2;H3或称F3,Ⅲ;H4或称F2A1,Ⅳ。有核的红细胞或个别生物体中,还存在特别的组蛋白成分,红细胞中为H5或F2C,Ⅴ,鲑鱼组织中为H6或T。H2A、H2B、H3、H4组成核小体的核心,也称核心组蛋白。根据组蛋白的一级结构,又可将它们分为3种类型:赖氨酸含量特别丰富的组蛋白(H1);赖氨酸含量较丰富的组蛋白(H2A和H2B);精氨酸含量丰富的组蛋白(H3和H4)。从整体来说,组蛋白在进化过程中保守性很强。其中H1变化较大,H3和H4变化最小。如对小牛胸腺的5种组蛋白,豌豆苗组蛋白的H3、H4和兔胸腺组蛋白H1等的一级结构比较中发现,小牛胸腺和豌豆苗的组蛋白H4间只在60位和77位上的两个氨基酸残基不同。但已知的真菌和原生动物的组蛋白的部分一级结构和动、植物的组蛋白间的差异较大。
组蛋白合成后的修饰 这是形成组蛋白各组分微不均一性的主要原因。修饰的方式有:①乙酰化。有两种,一种是H1、H2A、H4 组蛋白的氨基末端乙酰化,形成α-乙酰丝氨酸,组蛋白在细胞质内合成后输入细胞核之前发生这一修饰。二是在H2A、H2B、H3、H4的氨基末端区域的某些专一位置形成 N6-乙酰赖氨酸。②磷酸化。所有组蛋白的组分均能磷酸化,在细胞分裂期间,H1的1~3个丝氨酸可以磷酸化。而在有丝分裂时期,H1有3~6个丝氨酸或苏氨酸发生磷酸化,其他四个核心组蛋白的磷酸化可以发生在氨基末端区域的丝氨酸残基上。组蛋白的磷酸化可能会改变组蛋白与 DNA的结合。③甲基化。仅发现于H3的 9和27位和H4的20位的赖氨酸,鸭红细胞组蛋白H1和H5的组氨酸。④ADP-核糖基化。组蛋白H1、H2A、H2B及H3和多聚ADP-核糖的共价结合,ADP-核糖基化被认为是在真核细胞内启动复制过程的扳机。
非组蛋白 染色质中一大群分子量5000~ 15000的蛋白质的总称。真核细胞的非组蛋白可能有 100种以上。由于非组蛋白本身具有聚合特性,它们和组蛋白、核酸等也有结合能力,用电泳和层析技术完全分离非组蛋白比较困难,用双向电泳技术曾在兔肝和诺维科夫肝癌细胞分别分离到69个和84个组分。非组蛋白大致包含下列三类蛋白质:①细胞核内大量的酶。包括 DNA合成及修复过程中的DNA多聚酶和连接酶,核糖核酸(RNA)聚合酶,以及核酸和蛋白质如组蛋白在修饰过程中所需要的酶;②在染色体中起结构作用的蛋白质;③其他尚未阐明功能的蛋白质。非组蛋白在各种组织和细胞的分化及发育过程中以及在正常细胞向肿瘤细胞的转化过程中均会发生变化。各种不同的动物和组织中的非组蛋白成分也有较大的变化。非组蛋白能够选择性地和同源 DNA 结合,它们在RNA聚合酶作用下在体外能促进DNA的转录,所以有人认为染色质中的具有专一功能的非组蛋白在基因转录的选择性调控上起重要作用。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条