记录生活
分类 Category : 乱搞

新浪微博数据集抓取脚本

<Category: Python, 乱搞> 发表评论

分享个刚写的python脚本,用来抓取新浪微博的数据,其实这个脚本写了很久了,之前用这个脚本抓了几十G的数据,扔硬盘里一直没有用,前阵子win8刚出来,头脑一热就装了,还全格式化了那块盘,后面想要用的时候,才发现忘记把里面抓到数据拷出来了,悲催啊,还好脚本还在,今天完善了下,共享给大家,主要有如下功能:
支持多线程下载
用户id通过文件加载
按时间分目录
通过用户id取模划分子目录(如果你的id够多的话,避免单个文件夹下太多文件)
支持参数配置skip_count
支持下载完之后自动关机

支持命令行参数配置,具体查看帮助: -h
打包下载
阅读这篇文章的其余部分 »

本文来自: 新浪微博数据集抓取脚本

gitpage试玩并绑定域名

<Category: 乱搞> 发表评论

试玩下gitpage并绑定域名 创建medcl.gihub.com,注:必须是这种格式的repo:你的用户名.github.com。

D:>mkdir medcl.github.com
 
D:>cd medcl.github.com
 
D:\medcl.github.com>  git init
Initialized empty Git repository in /cygdrive/d/github.medc
l.com/.git/
 
D:\medcl.github.com>echo "I'll be back!">index.html
 
D:\medcl.github.com>echo medcl.github.com>CNAME
 
D:\medcl.github.com>cat CNAME
medcl.github.com
 
D:\medcl.github.com>git add .
 
D:\medcl.github.com>git commit -m 'first commit'
[master (root-commit) f09e419] first commit
 0 files changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 README
 
D:\medcl.github.com>git push -u origin master
Counting objects: 3, done.
Writing objects: 100% (3/3), 199 bytes, done.
Total 3 (delta 0), reused 0 (delta 0)
To git@github.com:medcl/medcl.github.com.git
 * [new branch]      master -> master
Branch master set up to track remote branch master from origin.

DNS添加一条A记录
github.medcl.com 207.97.227.245

ok,访问下看看

http://github.medcl.com/

http://medcl.github.com/

http://github.medcl.com/ElasticSearch.Net/

参考:

http://pages.github.com/

http://kyle.xlau.org/2010/12/29/github-.html

本文来自: gitpage试玩并绑定域名

foobar2000&新浪微博插件:foobar2000 Now Playing

<Category: 乱搞, 小道消息> 2 条评论

捕获1
简单介绍下,这个是播放器foobar2000的一个插件,功能是将你正在听的歌曲发送到新浪微博。
foobar版本:1.1.1 (其他版本未试)
下载地址:
http://bit.ly/foobar2k

这个component的起因纯属对饭否插件的怀恋(在学校的时候用饭否的插件记录了N多听歌的记录),还一个原因是因为之前用的饭否的插件居然有了广告(讨厌的链接),这个是让我很难容忍的,本来就短短的一句微博消息,居然加这么长的广告,叫我情何以堪啊,于是,哥自己倒腾一个得了。
注:饭否的api和新浪的api几乎一样,改改代码就可以用了。
源代码地址:https://github.com/medcl/foo_now_playing(包含所有依赖)
哈哈,我太open了。

小提示:在preferences里面设置你的账户密码即可(为什么不用oauth做验证?懒得搞,shit)

2000完整打包:http://github.com/downloads/medcl/foo_now_playing/foobar2000_all_pack.zip
只插件dll:http://github.com/downloads/medcl/foo_now_playing/foo_now_playing_v0.2.zip

所有版本下载地址:https://github.com/medcl/foo_now_playing/downloads

更新日志:
2010.12.26 版本0.2,修改前缀为我正在听,去掉##,不产生话题
下载地址:foo_now_playing_v0.2.zip

 

阅读这篇文章的其余部分 »

本文来自: foobar2000&新浪微博插件:foobar2000 Now Playing

域名批量查询脚本,附词典

<Category: Perl, 乱搞, 小道消息> 发表评论

whois domain query tool

批量whois查询域名是否被注册的perl脚本,支持词典,支持任何后缀的域名,原理很简单,调用whois命令,比较返回结果。windows(cygwin)、linux测试通过。
使用方法: domain.pl '.com' 'domain(3).dict' #第一个参数为域名后缀,第二个为字典路径,两个参数都为必填哦。
阅读这篇文章的其余部分 »

本文来自: 域名批量查询脚本,附词典

dd-wrt u盘 脱机 amule 改造全纪录

<Category: Wireless, 乱搞> 发表评论

U盘挂载

设置u盘挂载目录(此处为/mnt),服务-》usb-》该打的都打钩,fat文件系统和usb
插入u盘或读卡器(内有卡,废话)
启用jffs,管理-》jffs2-》启用
putty登入路由

阅读这篇文章的其余部分 »

本文来自: dd-wrt u盘 脱机 amule 改造全纪录

dd-wrt 实验2

<Category: Wireless, 乱搞> 发表评论

参考:http://blog..com.cn/s/blog_51f1a4130100gpl7.html

1.停用自动挂载磁盘 服务-》usb

umount /opt

mount -o noatime /dev/scsi/host0/bus0/target0/lun0/part1 /opt
阅读这篇文章的其余部分 »

本文来自: dd-wrt 实验2

dd-wrt初体验

<Category: Wireless, 乱搞, 未分类> 发表评论

网购的华硕wl-520gc今天终于到了,哈哈,回家马上试试看,
240MHz的cpu,64M的内存还剩94%,这小东西还挺强悍啊,不管了,先配上3322.org的ddns。
dd-wrt-0
dd-wrt-1
dd-wrt-2

本文来自: dd-wrt初体验