曲曲的秘密学术基地

纯化欲望、坚持严肃性

欢迎!我是曲泽慧(@zququ),目前在深圳(ICBI,BCBDI,SIAT)任职助理研究员。


病毒学、免疫学及结构生物学背景,可以在 RG 上找到我已发表的论文

本站自2019年7月已访问web counter

python爬取ncbi检索信息的摸索(2) 找到隐藏背后的真实地址

在用python requests爬取ncbi数据库时候,会有个苦恼的地方,就是在通过ncbi数据库检索到蛋白后,地址栏给出的地址是隐藏的,即使你通过该出的该地址也无法打开对应的地址网页,也就无法正常爬取网页信息,如下图所示,

figure1

可以看到即使我更改Summary为Fasta,并且将20 per page更改为200 per page,也无法看到完整的地址信息,

figure2

下面我来介绍如何将完整的地址找到,

首先inspect,并查看Network 选项,要注意重新刷新,比如说将20 per page更改为200 per page,Network才会刷新记录,结果如图:

figure3

选择光标处的 protein,在Headers 菜单中寻找到这个菜单栏,如图,

figure4

在该栏目中选择view source,并赋term=...地址,粘贴到地址栏中,如图所示,

figure5

可以尽情的爬了!祝爬虫愉快!

Last One

python 时间处理模块总结

整理自小甲鱼鱼C论坛python中与时间处理总结Python中,与时间有关的模块包括:time,datetime以及calender。 datetime模块datetime支持的时间范围object.MINYEAR = 1object.MAXYEAR = 9999timedelta类属性 timedelta.min timedelta(-999999999) timedelta.max timedelta(day...…

pythonMore
Next One

汇编语言 9.7 9.8 jcxz loop 指令

9.7 jcxz 指令jcxz 指令为有条件转移指令,所有的有条件转移指令都是短转移,在对应的机器码中包含转移的位移,而不是目的地址。对IP的修改范围都为:-128~127。指令格式:jcxz 标号(如果(cx)=0, 转移到标号处执行。)操作:当(cx)=0时,(IP)=(IP)+8位位移;8位位移 = 标号处的地址 - jcxz指令后的第一个字节的地址;8位位移的范围为-128~127,用补码表示;8位位移由编译程序在编译时算出。当(cx)!=0时,程序继续向下执行。我们从jcxz的功...…

汇编语言More