基本的命令
启动服务:sudo service mongod start
或者systemctl start mongod
mongod --dbpath=/data/db --port=27017
//有两个参数,如果不加,就执行默认的端口
终止服务:
sudo service mongod stop
或者ctrl + c
启动服务:sudo service mongod start
或者systemctl start mongod
mongod --dbpath=/data/db --port=27017
//有两个参数,如果不加,就执行默认的端口
终止服务:
sudo service mongod stop
或者ctrl + c
通过 Node.js 实现一个简单爬虫,爬取豆瓣热门电影。主要会用到的模块(包)有:http,fs,path,cheerio。
这里用一个跑在本地的 http server 来模拟在线爬豆瓣网。
douban-server.tar.gz 是由实验楼提供的在本地模拟豆瓣网的程序。具体的代码实现参考 git:ipoplar ,其中 growth.md 是遇到的问题。
解压 douban-server.tar.gz1
tar zxvf douban-server.tar.gz
进入解压后的目录,启动服务:
1 | npm start |
创建文件夹 spider, 进入文件夹,输入 npm init
, 初始化项目,会得到类似与小编的文件。(在初始化项目要添加第三方包 npm install cheerio --save
)
运行 node spider.js
会抓取到想要的信息(将抓取到的图片放到 img 文件夹下,将电影信息放置在 data/data.json 中)
cheerio 为服务器特别定制的,快速,灵活, 实施的jQuery核心实现。
可用通过如下命令进行安装:npm install cheerio
Features
相似的语法: 包括了jQuery核心的子集。
闪电般的快: 工作在一个非常简单,一致的DOM模型之上。高效的完成解析, 操作, 呈送。(基础的端到端的基准测试显示 Cheerio 大约比 JSDOM 快八倍)。
巨灵活: cheerio 封装了兼容 htmlparser。cheerio 几乎能够解析任何的 HTML 和 XML document。
Loading
1 | var cheerio = require('cheerio'); |
或者通过传递字符串作为内容来加载 HTML:
1 | $ = require('cheerio'); |
Or as the root:
1 | $ = require('cheerio'); |
你也可以传递一个额外的对象给.load()如果你需要更改任何的默认解析选项的话:
1 | $ = cheerio.load('<ul id="fruits">...</ul>', { |
这些解析选项都是直接来自htmlparser ,因此任何在htmlparser里有效的选项在Chreeio里也是行得通的。默认的选项如下:
1 | { |
在此是对实验楼的练习笔记的整理,有兴趣的小伙伴可以到实验楼这个非常棒的平台去练练~
原始Ajax
1 | <!doctype html> |
在此是对实验楼的练习笔记的整理,有兴趣的小伙伴可以到实验楼这个非常棒的平台去练练~
看一段简单的代码段,回顾jQuery的使用方式
(内部的代码片段是截取了js部分,显示不同的功能)
1 | <!doctype html> |
表单选择器
:input
:text
:password
:radio
:checkbox
:submit
:image
:reset
:button
:file
:hidden