09,12,2019
|
dengwen168 |
一、简介
使用决策树, 线性回归, 向量机等机器学习的方法进行股票价格预测。
二、获取数据的方法
打开大智慧的股票界面,右键->复制数据,然后粘贴到Excel中即可。
然后在指标窗格切换指标,再复制到Excel中即可。
三、知识点
1.classification_report
其中列表左边的一列为分类的标签名(label),
precision recall f1-score三列分别为各个类别的精确度/召回率及 F1值.右边support列为每个标签的出现次数 ...
08,12,2019
|
dengwen168 |
机器学习可以主要分为几类:监督学习,非监督学习,增强学习及推荐系统等。
一、第三课 Pandas
1.代码1
import pandas as pd
def test_run():
start _date='2010-01-01'
end_date = '2011-01-26'
dates = pd.date_range(start_date,end_date)
df1 = pd.DateFrame(index=dates)
dfspy = pd.read_csv("data/spy.csv",index_col = "Date",parse_ ...
08,12,2019
|
dengwen168 |
简要目录:
一、概述
我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学习涉及到的一些最常用的的数学知识。
二、线性代数
2-1、标量
2-2、向量
2-3、矩阵
2-4、张量
2-5、范数
2-6、特征分解
2-7、奇异值分解(Singular Value Dec ...
07,12,2019
|
dengwen168 |
一、机器学习领域主要术语的英文表达
https://www.cnblogs.com/ArrozZhu/p/8397160.html
二、LR,gbdt,libfm这三种模型分别适合处理什么类型的特征?
1、gbdt模型是非线性模型,可以输入统计类特征,特征维度一般几十到几百维。统计类特捕捉的是影响最终效果的总体或者说全局性的因素。曾看到过腾讯技术博客里给gbdt模型输入海量特征,但个人感觉gbdt不适合海量特征,因为一方面可能只有较少特征有作为划分 ...
06,12,2019
|
dengwen168 |
https://www.youtube.com/watch?v=7vunJlqLZok(Finteck及预测股价)
待看:
https://www.youtube.com/watch?v=V7UGqi83iJw
https://www.youtube.com/watch?v=3udlmtxDNoU
https://www.youtube.com/watch?v=w_Lhofuy2Kg
https://www.youtube.com/watch?v=XyrZqqNTkGM
时间序列分类
https://mp.weixin.qq.com/s/EF2r1GHB6JUJYLlU4idxYA
06,12,2019
|
dengwen168 |
一、tradingview
tradingview上面可以下载国内A股的数据,并导出为CSV。
https://www.tradingview.com/
二、知识点
1.brain.js
Kao!现在真是什么都往机器学习上靠,就是在浏览器端实现机器学习的这么一个东东。
想了解的可以看这里:https://www.jianshu.com/p/decbabe10793
三、原理解释
四、实现
可参考:https://www.youtube.com/watch?v=TLu9cn2UQ6w
这个还没看完:
A Guided Tour Of Machine Learni ...
06,12,2019
|
dengwen168 |
一、dukascopy
https://www.dukascopy.com/swiss/english/home/
可参考:https://www.youtube.com/watch?v=RM54GNHmWk4
05,12,2019
|
dengwen168 |
一、介绍
在CTR预估问题的发展初期,使用最多的方法就是逻辑回归(LR),LR使用了Sigmoid变换将函数值映射到0~1区间,映射后的函数值就是CTR的预估值。
LR属于线性模型,容易并行化,可以轻松处理上亿条数据,但是学习能力十分有限,需要大量的特征工程来增加模型的学习能力。但大量的特征工程耗时耗力同时并不一定会带来效果提升。因此,如何自动发现有效的特征、特征组合,弥补人工经验不足,缩短LR特征实 ...
04,12,2019
|
dengwen168 |
Q:有个疑问就是,模型本身不是线性的,为什么一定要先用线性模型做?
A:有核函数和泰勒展开等等,可以无限逼近转化成线性?
小知识:
1.Sigmoid函数,即f(x)=1/(1+e-x)。是神经元的非线性作用函数。广泛应用在神经网络中。又叫Logistic函数。
机器学习中一个重要的预测模型逻辑回归(LR)就是基于Sigmoid函数实现的。LR模型的主要任务是给定一些历史的{X,Y},其中X是样本n个特征值,Y的取值是{0,1}代表正 ...
30,11,2019
|
dengwen168 |
一、简单介绍
二、知识点
1.np.sign
2.iloc[:,:-1]
提取所有行,而后提取除最后一列之外的所有列。
3.clf.fit(x,y)
比如下面代码中的train_df.iloc[:,-1:]就是label那一列。
4. sklearn 保存模型
经实测可用
from sklearn import svm
from sklearn import datasets
clf = svm.SVC()
iris = datasets.load_iris()
X, y = iris.data, iris.target
clf.fit(X,y)
import pickle #pickle模块
...
Page: 73 of 213 1 ...
71 72 73 74 75 ...
213