python爬取ncbi检索信息的摸索(2) 找到隐藏背后的真实地址

在用python requests爬取ncbi数据库时候，会有个苦恼的地方，就是在通过ncbi数据库检索到蛋白后，地址栏给出的地址是隐藏的，即使你通过该出的该地址也无法打开对应的地址网页，也就无法正常爬取网页信息，如下图所示，

可以看到即使我更改Summary为Fasta，并且将20 per page更改为200 per page，也无法看到完整的地址信息，

下面我来介绍如何将完整的地址找到，

首先inspect，并查看Network 选项，要注意重新刷新，比如说将20 per page更改为200 per page，Network才会刷新记录，结果如图：

选择光标处的 protein，在Headers 菜单中寻找到这个菜单栏，如图，

在该栏目中选择view source，并赋term=...地址，粘贴到地址栏中，如图所示，

可以尽情的爬了！祝爬虫愉快！

python 时间处理模块总结

整理自小甲鱼鱼C论坛python中与时间处理总结Python中，与时间有关的模块包括：time，datetime以及calender。 datetime模块datetime支持的时间范围object.MINYEAR = 1object.MAXYEAR = 9999timedelta类属性 timedelta.min timedelta(-999999999) timedelta.max timedelta(day...…

2019-12-04 • pythonMore

汇编语言 9.7 9.8 jcxz loop 指令

9.7 jcxz 指令jcxz 指令为有条件转移指令，所有的有条件转移指令都是短转移，在对应的机器码中包含转移的位移，而不是目的地址。对IP的修改范围都为：-128~127。指令格式：jcxz 标号(如果(cx)=0, 转移到标号处执行。)操作：当(cx)=0时，(IP)=(IP)+8位位移；8位位移 = 标号处的地址 - jcxz指令后的第一个字节的地址；8位位移的范围为-128~127，用补码表示；8位位移由编译程序在编译时算出。当(cx)!=0时，程序继续向下执行。我们从jcxz的功...…

2019-12-02 • 汇编语言More