摘要: Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key、value的字节大小以及服务器硬件性能,日常环境中QPS高峰大约在4-6w左右)。
1.Memcached
Memcached的优点:Memcached可以利用多核优势,...
7年前 (2018-06-01) 2599℃ 0评论
0喜欢
云搜索系统设置
1. 应用基本信息(名称、备注)
2. 数据存储量 (对应需要多少主分片)
3. 吞吐量tps (对应需要多少副本)
4. 数据源(topic、tag)
5. 定义应用结构(template)
6. 索引字段(倒排字段,用于query)及属性字段(正排字段用于过滤...
7年前 (2018-05-25) 2385℃ 0评论
0喜欢
概述
谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。
解决问题的层面不一样
&nbs...
7年前 (2018-05-16) 2117℃ 0评论
0喜欢
八大学报
1.计算机学报
2.软件学报
3.计算机科学与技术学报(JCST)
4.计算机研究与发展
5.自动化学报
6.电子学报
7.通信学报
8.中国科学
被SCI检索的国外期刊(顶级会议)
新排名 2004部分核心期刊名单(自动化、计算机部分与无线电、电信部分)
自...
7年前 (2018-05-09) 4925℃ 0评论
0喜欢
NSP分词算法是句子粗分的基本算法,在中科院计算所的文章中有详细描述。但是看了不甚明白,今天实现了这个算法,主要用的还是图论的基本算法Dijkstra算法。
将分词转化为图的最短路径问题假设要切分一下句子 :主席出现在这里。可将其转化为以下的图:
从而,找出这个句子的最短切分的...
7年前 (2018-05-09) 3318℃ 0评论
0喜欢
什么是中文分词
与大部分印欧语系的语言不同,中文在词与词之间没有任何空格之类的显示标志指示词的边界。因此,中文分词是很多自然语言处理系统中的基础模块和首要环节。
下面以jieba的示例给读者一个对分词的感性认识。
【全模式】: 我/ 来到/ 北京/&...
7年前 (2018-05-09) 2834℃ 0评论
0喜欢
文/赵玉锡
2004 年进入华为,一直在消息产品开发一线耕耘,今年下半年转入华为融合视频业务。曾参与多个重要项目与重要版本的设计、重构与开发,辗转多个语言:长期从事 C、C++ 开发,Java 与 Python 也有约 30K+ 代码的开发经验,目前正在基于 Go 语言开发,对 ...
7年前 (2018-05-09) 3243℃ 0评论
0喜欢
Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。
它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。
Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,...
7年前 (2018-05-09) 2593℃ 0评论
1喜欢
当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求。随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战。本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch。两者都...
7年前 (2018-05-09) 3013℃ 0评论
0喜欢
Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Hadoop、Spark等),被多种查询引擎支持(Hive、Impala、Drill等),并且它是语言和平台无关的。Parquet最初是由Twitter和Clo...
7年前 (2018-05-09) 3636℃ 0评论
0喜欢
分布式系统中,即便是一个小型的集群,也需要通过一个机制来维护各个节点或服务的状态一致性和数据一致性。zab、paxos是使用较早的协议,后来出现了RAFT协议,这些主要通过RPC的机制进行节点连接,因此主要用于局域网或数据中心内部。Gossip(意:八卦、流言)支持p2p协议,是...
7年前 (2018-05-09) 4635℃ 0评论
4喜欢
前言
Apache Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的数据分析能力。Kudu支持水平扩展,使用Raft协议进行一致性保证,并且与Cloudera Impala和Apache Spark等当前流行的大数据查询和分析工具结合紧密。本文将为...
7年前 (2018-05-09) 2803℃ 0评论
0喜欢
产品经理工作中,画流程图是必经的一环。对于工具狂魔来说,和介于产品经理的通病,只要能画流程图的工具,总想体验一番。
我用过的流程图工具有Visio、MindManager、亿图图示专家(Edraw Max)、PPT、Axure等。
首先,用Axure画流程图,对我来说,真废时间啊...
7年前 (2018-05-07) 4126℃ 0评论
0喜欢
HDFS文件系统
一、HDFS设计
HDFS为hadoop的核心组件,为hadoop底层的文件存储系统。它通常运行在商用硬件集群上,用来存储超大文件、大规模文件。
1、超大文件
&q...
7年前 (2018-04-28) 2390℃ 0评论
0喜欢
作者:何幻链接:https://www.zhihu.com/question/26646855/answer/68503768来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
后文于2016.07.20新增内容,以下是原文。– R...
7年前 (2018-04-25) 2484℃ 0评论
0喜欢
五种英特尔消费级CPU,说它们是消费级是为了和企业级处理器Xeon(志强)区分:
– 赛扬是双核,不支持超线程 – 入门玩家
– 奔腾是双核,不支持超线程 – 中低端玩家
– i3是双核,支持超线程 – 中端...
7年前 (2018-04-17) 12676℃ 0评论
3喜欢
CPA、CPC、CPT、CPM、CVR、CTR、PV、UV相关计算公式:
ROI=订单额/消费量(即广告费用)=(单均额*转化量)/(CPA*转化量)=单均额/CPA
CTR=点击量/展现量
CVR=转化量/点击量
CPM=(消费量/展现量)*1000
CPA=消费量/转化量=(...
7年前 (2018-04-13) 303952℃ 0评论
754喜欢
alternatives是Linux下的一个功能强大的命令。只能在root权限下执行。如系统中有几个命令功能十分类似,却又不能随意删除,那么可以用 alternatives 来指定一个全局的设置。alternatives常用于同一个系统中安装同一软件的多个版本。比如为了开发需要,...
7年前 (2018-04-12) 3110℃ 0评论
0喜欢
目前我的理解是超五类网线能传输的最高速度是155/8=19MB/S,这个数据跟真实的案例存在冲突,一根超五类网线在两台千兆网卡的电脑上实现双机互联,传输速度能达到125MB/S。这个传输速度让我对“超五类网线带宽为155Mbps”数据迷惑了。千兆网卡最大传输速度是1000/8=1...
7年前 (2018-04-10) 16916℃ 0评论
34喜欢
很多朋友在自已家接网线的时候,通常搞不清楚网线里面八根铜导线,哪几根才是保证网络传输正常的?首先要知道的是八根铜导线的整体作用,八根铜导线是为了削减电磁信号的彼此搅扰,每两根按必定的密度缠绞在一起。这样,在传输电信号时彼此之间辐身出的电波就会彼此抵消,有用的消除搅扰。双绞线这个名...
7年前 (2018-04-10) 8290℃ 0评论
5喜欢