来源:http://tech.meituan.com/mysql-index.html 美团技术博客
MySQL凭借着出色的性能、低廉的成本、丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库。虽然性能出色,但所谓“好马配好鞍”,如何能够更好的使用它,已经成为开发工程师的必修课,我们经常会从职位描述上看……继续阅读 »
4年前 (2015-09-02) 625浏览 0评论
0个赞
来源:http://tech.meituan.com/hive-sql-to-mapreduce.html 美团网技术博客
Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常……继续阅读 »
4年前 (2015-09-02) 1152浏览 0评论
0个赞
……继续阅读 »
4年前 (2015-06-15) 924浏览 1评论
0个赞
编程基础:
逻辑思维:
图中有多少个 正方形?数的过程和思路。
算法基础:
常用排序算法及……继续阅读 »
4年前 (2015-06-15) 770浏览 0评论
0个赞
原文地址:http://www.infoq.com/cn/articles/weibo-relation-service-with-redis/
新浪微博的工程师们曾经在多个公开场合都讲到过,微博平台当前在使用并维护着可能是世界上最大的Redis集群,其中最大的一个业务,单个业务使用了超过 10T 的内存,这里说的就是微博关系服务。
风起
2009年微博刚刚……继续阅读 »
4年前 (2015-06-11) 811浏览 0评论
0个赞
在介绍yield前有必要先说明下Python中的迭代器(iterator)和生成器(constructor)。
一、迭代器(iterator)
在Python中,for循环可以用于Python中的任何类型,包括列表、元祖等等,实际上,for循环可用于任何“可迭代对象”,这其实就是迭代器
迭代器是一个实现了迭代器协议的对象,Python……继续阅读 »
4年前 (2015-06-02) 672浏览 0评论
0个赞
原文:http://www.haohaoblog.com/?p=1327
做Java编程的人其实,很多不懂SEO,也不知道如何让百度收录等等,当然,对于爬虫,网页抓取,也不是所有编程的人有考虑到,但是专门做这个人,还是需要了解一下这里面的知识的,那下面就来介绍一下一些爬虫和网页采集相关的组件和插件吧~
大家在做爬虫、网页采集、通过网页自动写入数……继续阅读 »
4年前 (2015-04-23) 3348浏览 0评论
3个赞
Java构造和解析Json数据的两种方法详解一
http://www.cnblogs.com/lanxuezaipiao/archive/2013/05/23/3096001.html
Java构造和解析Json数据的两种方法详解二
http://www.cnblogs.com/lanxuezaipiao/archive/2013……继续阅读 »
4年前 (2015-03-30) 697浏览 0评论
0个赞
遇到一个案例,需要抓取1w+个链接,php的顺序循环调用curl抓取需要2小时以上,不满足需求。
通过使用curl_multi可以将抓取时间缩小至20分钟以内。
步骤大约如下:
第一步:调用curl_multi_init
第二步:循环调用curl_multi_add_handle
这一步需要注意的是,curl_multi_add_handl……继续阅读 »
4年前 (2015-03-12) 1193浏览 0评论
1个赞
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<?php
/**********************************************************************……继续阅读 »
4年前 (2015-03-12) 641浏览 0评论
0个赞