<Date: 2011-11-18>
<Author: medcl>
<Category: Python, 乱搞>
分享个刚写的python脚本,用来抓取新浪微博的数据,其实这个脚本写了很久了,之前用这个脚本抓了几十G的数据,扔硬盘里一直没有用,前阵子win8刚出来,头脑一热就装了,还全格式化了那块盘,后面想要用的时候,才发现忘记把里面抓到数据拷出来了,悲催啊,还好脚本还在,今天完善了下,共享给大家,主要有如下功能:
支持多线程下载
用户id通过文件加载
按时间分目录
通过用户id取模划分子目录(如果你的id够多的话,避免单个文件夹下太多文件)
支持参数配置skip_count
支持下载完之后自动关机
支持命令行参数配置,具体查看帮助: -h
打包下载
阅读这篇文章的其余部分 »

本文来自: 新浪微博数据集抓取脚本
<Date: 2011-11-18>
<Author: medcl>
<Category: 乱搞>
试玩下gitpage并绑定域名 创建medcl.gihub.com,注:必须是这种格式的repo:你的用户名.github.com。
D:>mkdir medcl.github.com
D:>cd medcl.github.com
D:\medcl.github.com> git init
Initialized empty Git repository in /cygdrive/d/github.medc
l.com/.git/
D:\medcl.github.com>echo "I'll be back!">index.html
D:\medcl.github.com>echo medcl.github.com>CNAME
D:\medcl.github.com>cat CNAME
medcl.github.com
D:\medcl.github.com>git add .
D:\medcl.github.com>git commit -m 'first commit'
[master (root-commit) f09e419] first commit
0 files changed, 0 insertions(+), 0 deletions(-)
create mode 100644 README
D:\medcl.github.com>git push -u origin master
Counting objects: 3, done.
Writing objects: 100% (3/3), 199 bytes, done.
Total 3 (delta 0), reused 0 (delta 0)
To git@github.com:medcl/medcl.github.com.git
* [new branch] master -> master
Branch master set up to track remote branch master from origin.
DNS添加一条A记录
github.medcl.com 207.97.227.245
ok,访问下看看
http://github.medcl.com/
http://medcl.github.com/
http://github.medcl.com/ElasticSearch.Net/
参考:
http://pages.github.com/
http://kyle.xlau.org/2010/12/29/github-CNAME.html

本文来自: gitpage试玩并绑定域名
<Date: 2010-12-18>
<Author: medcl>
<Category: 乱搞, 小道消息>

简单介绍下,这个是播放器foobar2000的一个插件,功能是将你正在听的歌曲发送到新浪微博。
foobar版本:1.1.1 (其他版本未试)
下载地址:
http://bit.ly/foobar2k

这个component的起因纯属对饭否插件的怀恋(在学校的时候用饭否的插件记录了N多听歌的记录),还一个原因是因为之前用的饭否的插件居然有了广告(讨厌的链接),这个是让我很难容忍的,本来就短短的一句微博消息,居然加这么长的广告,叫我情何以堪啊,于是,哥自己倒腾一个得了。
注:饭否的api和新浪的api几乎一样,改改代码就可以用了。
源代码地址:https://github.com/medcl/foo_now_playing(包含所有依赖)
哈哈,我太open了。
小提示:在preferences里面设置你的账户密码即可(为什么不用oauth做验证?懒得搞,shit)
foobar2000完整打包:http://github.com/downloads/medcl/foo_now_playing/foobar2000_all_pack.zip
只插件dll:http://github.com/downloads/medcl/foo_now_playing/foo_now_playing_v0.2.zip
所有版本下载地址:https://github.com/medcl/foo_now_playing/downloads
更新日志:
2010.12.26 版本0.2,修改前缀为我正在听,去掉##,不产生话题
下载地址:foo_now_playing_v0.2.zip
阅读这篇文章的其余部分 »

本文来自: foobar2000&新浪微博插件:foobar2000 Now Playing
<Date: 2010-09-16>
<Author: medcl>
<Category: Perl, 乱搞, 小道消息>

批量whois查询域名是否被注册的perl脚本,支持词典,支持任何后缀的域名,原理很简单,调用whois命令,比较返回结果。windows(cygwin)、linux测试通过。
使用方法: perl domain.pl '.com' 'domain(3).dict' #第一个参数为域名后缀,第二个为字典路径,两个参数都为必填哦。
阅读这篇文章的其余部分 »

本文来自: 域名批量查询脚本,附词典
<Date: 2010-07-20>
<Author: medcl>
<Category: Wireless, 乱搞>
U盘挂载
设置u盘挂载目录(此处为/mnt),服务-》usb-》该打的都打钩,fat文件系统和usb
插入u盘或读卡器(内有卡,废话)
启用jffs,管理-》jffs2-》启用
putty登入路由
阅读这篇文章的其余部分 »

本文来自: dd-wrt u盘 脱机 amule 改造全纪录
<Date: 2010-07-20>
<Author: medcl>
<Category: Wireless, 乱搞>
参考:http://blog.sina.com.cn/s/blog_51f1a4130100gpl7.html
1.停用自动挂载磁盘 服务-》usb
umount /opt
mount -o noatime /dev/scsi/host0/bus0/target0/lun0/part1 /opt
阅读这篇文章的其余部分 »

本文来自: dd-wrt 实验2
<Date: 2010-07-15>
<Author: medcl>
<Category: Wireless, 乱搞, 未分类>