0%

1. Introduciton

1.1 Job description

本项目为京东评论数据爬虫。随着电子商务的发展,有如京东、淘宝等网站,在线评论作为电子口碑显著影响着产品的营销策略。

Read more »

1. Introduction

1.1 Job description

本项目为企查查注册企业信息爬取,项目来源是别人的实验需求。故本博客会对项目的具体数据进行脱敏处理,其中涉及的 1168 个链接本文不进行提供,也不提供成品数据。

Read more »

1. Introduction

This is a test file!

Read more »

1. Introduction

  1. 投资者情绪等指数对石油价格(收益率)的预测(or predictability);如投资者看涨、看跌的情绪.
  2. 投资者关注度。如对石油市场的关注度(可以借助谷歌指数)、对石油政策、绿色消费、碳中和等的关注度等;
  3. 基于数据挖掘对石油价格的预测。挖掘一些新的创意点对油价进行预测,初步拟定爬取新闻文本,之后借助自然语言处理分析投资者情绪,情感分析,投资者关注度等。

虽然研究的是油价预测,但油价其实只是一个载体,换成其他的商品处理逻辑也差不多,只是因为课题是能源金融,需要一个载体来契合这个点。

Read more »

1. Study goals

  • 学习词向量的概念
  • 用 Skip-thought 模型训练词向量
  • 学习使用 PyTorch dataset和 dataloader
  • 学习定义 PyTorch 模型
  • 学习 torch.nn 中常见的 Module
    • Embedding
  • 学习常见的 PyTorch operations
    • bmm
    • logsigmoid
  • 保存和读取 PyTorch 模型
Read more »

1. 什么是PyTorch?

PyTorch是一个基于Python的科学计算库,它有以下特点:

  • 类似于 NumPy,但是它可以使用 GPU
  • 可以用它定义深度学习模型,可以灵活地进行深度学习模型的训练和使用
Read more »

Statement: This series of post records the personal notes and experiences of learning the BiliBili video tutorial "Pytorch 入门学习", most of code and pictures are from the courseware PyTorch-Course. All posted content is for personal study only, do not use for other purposes. If there is infringement, please contact e-mail:yangsuoly@qq.com to delete.

Read more »

1 Modeling creation

经过前面的学习,已可以对数数据进行增删查补和清洗工作。接下来需要使用处理好的数据进行分析和建模。这一章要做的是运用数据来得到某些结果。

分析的第一步是搭建一个预测模型或者其他;根据模型的结果,可以分析该模型是否可靠。

Read more »

前文已经对数据分析的基本操作进行了学习,接下来要进行数据清洗、数据特征提取、数据重构以及数据可视化的学习。

1 Data cleaning

1.1 Load data

1
2
3
4
5
import numpy as np
import pandas as pd

df = pd.read_csv('./train.csv')
df.head(3)
Read more »