【大数据实战项目四】Mongo/ES数据储存及利用Flask进行结果展示

网友投稿 236 2022-11-16

【大数据实战项目四】Mongo/ES数据储存及利用Flask进行结果展示

Mongo/ES数据储存及利用Flask进行结果展示

​​5 数据储存及结果展示​​

​​5.1 将数据保存到MongoDB​​​​5.2 利用Flash进行数据结果展示​​

​​5.2.1 将数据展示到指定页面​​​​5.2.2 数据筛选显示​​​​5.2.3 美化数据输出​​​​5.2.4 多数据分页显示​​​​5.2.5 制作具有查询功能的页面​​

作者:Be_melting

5 数据储存及结果展示

在收集了航班数据之后,我们进行了基础的处理,去除了不需要的部分,对空值进行了处理,现在我们需要把数据存储到NoSQL的数据库中。

存储的这一步,我们使用之前准备的MongoDB和ES作为存储服务器,这样后面就可以利用Flask应用服务器对数据进行展示处理,该部分属于下图中框中的内容。

5.1 将数据保存到MongoDB

重新创建一个文件,命名为example03.py,然后打开Compass软件,连接上数据库(如果没有连接数据库,最后写入的时候会报写入网络错误)。

接着在创建的文件中重现加载Spark的环境和激活之前自定义的pymogo_spark程序,就能够直接使用saveToMongoDB()的方法直接将数据写入数据库,但是需要注意的是要先将数据换成为字典的格式,代码及运行结果如下。

最后刷新一下Compass页面,检查其中的数据库情况,对应界面如下,证明成功写入数据到数据库。

5.2 利用Flash进行数据结果展示

5.2.1 将数据展示到指定页面

在step1文件夹下创建一个web文件夹,里面包含两个固定的文件夹为static和templates,然后把boostrap相关的4个文件移动到static文件夹下,在templates文件夹下创建一个index.html文件。接着就是在web文件夹下创建一个on_time01.py文件,将3.4部分介绍利用Flask搭建网站的代码直接挪用,然后添加如下代码。

@app.route('/on_time')def on_time(): flight = client['example'].on_time.find_one() return json_util.dumps(flight)

程序执行后,在浏览器端的网址路径下添加/on_time回车后,就可以输出如下内容。(利用Flask很快速就将数据从Mongo DB中展示到网页上)

5.2.2 数据筛选显示

按照运营商、飞行航班、飞行时间字段进行筛选显示,丰富on_time()函数中的内容如下。

@app.route('/on_time')def on_time(): carrier = request.args.get('Carrier') flight_date = request.args.get('FlightDate') flight_num = request.args.get('FlightNum') # print (carrier,flight_date,flight_num) flight = client['example'].on_time.find_one( { 'Carrier': carrier, 'FlightDate': flight_date, 'FlightNum': flight_num } ) return json_util.dumps(flight)

创建完毕后,重新运行on_time01.py后,指定一个查询条件,进行查询,比如查询网址:美化数据输出

上面数据的输出就是单纯的把结果展示出来,没有美感,可以利用boostrap进行页面的美化。之所以选择使用boostrap,就是因为不需要自己了解太多的前端技术,直接把示例样本的代码部分copy过来就可以直接使用,比如在index.html文件中添加如下代码。

大数据分析项目

{% block body2 %}{% endblock %}