Matlab-爬取论文数据
家电修理 2023-07-16 19:16www.caominkang.com电器维修
现在网上的爬虫程序很多,但大多不实用!今天,我们以爬取论文数据为例了解Matlab爬虫!
,明确我们要爬取什么数据!如下图,第一张图片表示年积日,第二张图片表示第一天里有哪些数据,我们打算爬取一年的ionPrf数据!
1.构造网址,分别是
‘https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/001/’
…
‘https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/365/’
the_url='https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/';
for i=1:365
doy=sprintf('%03d',i);
url=[the_url,doy,'/'];
end
2.读取页面源代码
contents=ebread(url);
3.解析页面源代码
hT=htmlTree(contents);
4.从hT中寻找...
A_label=findElement(hT,'a');
5.获取链接
url_donload=getAttribute(A_label,'href');
6.找到ionPrf文件在数组里的位置,然后提取出来
flag=cellfun(@isempty,regexp(url_donload,'ionPrf')); url_donload=url_donload(~flag);
7.组合网页链接
url_donload=url+url_donload;
结果示例https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/001/ionPrf_postProc_2016_001.tar.gz
8.下载数据
% filename自己设置,这里不展开 ebsave(filename,url_donload);
完整代码见面包多
上一篇:android 11 修改系统语言为中文 下一篇:操作系统面试题
空调维修
- 我的世界电脑版运行身份怎么弄出来(我的世界
- 空调抽湿是什么意思,设置抽湿的温度有什么意
- 方太燃气灶有一个打不着火 怎么修复与排查方法
- 夏季免费清洗汽车空调的宣传口号
- 清洗完空调后出现漏水现象
- iphone6能玩什么游戏(iphone6游戏)
- 如何设置电脑密码锁屏(如何设置电脑密码锁屏
- win10删除开机密码提示不符合密码策略要求
- 电脑w7显示不是正版(w7不是正版怎么解决)
- 万家乐z8热水器显示e7解决 怎么修复与排查方法
- 1匹空调多少瓦数(1匹空调多少瓦)
- 安卓手机连接电脑用什么软件好(关于安卓手机
- 电脑网页看视频卡是什么原因(爱拍看视频卡)
- 华帝燃气灶点火器一直响然后熄火怎么办:问题
- 电脑壁纸怎么换(关于电脑壁纸怎么换的介绍)
- 冬天空调的出风口应该朝什么方向(冬天空调风