机器学习之主成分分析(PCA&特征选择)
特征选择 特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: (1)减少特征数量、降维,使模型泛化能力更强,减少过拟合 (2)增强对特征和特征值之间的理解 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。 PCA PCA是一种数学降维方法,利用正交变换把一系列可能线性相关
Machine Learning 之一,什么是机器学习。
Machine Learning 机器学习,什么是机器学习。我觉得尚学堂的培训老师讲的很不错,就是两个字来介绍。------拟人。 就是模拟人类的思维方式。 老师举的例子: 和女朋友约会,第一次约会,约定是晚上七点到,但是女朋友7点十分才到。 第二次,约会,约定也是晚上七点到,但是女朋友还是7点十分才到。 那么第三次呢,这位男同志就可能会通过前两次约会的经验,做出女朋友迟到十分钟的预测,就是概率。也晚十分钟出门,十分钟可以看看书,
机器学习性能评估指标
因为接触到机器学习的部分知识,不是很懂。以下内容来自知乎,作为笔记留存。 作者原文博客:http://charleshm.github.io/2016/03/Model-Performance/ 作者:Charles Xiao 链接:https://www.zhihu.com/question/19645541/answer/91694636 精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是对
机器学习之分类回归树(python实现CART)
之前有文章介绍过决策树(ID3)。简单回顾一下:ID3每次选取最佳特征来分割数据,这个最佳特征的判断原则是通过信息增益来实现的。按照某种特征切分数据后,该特征在以后切分数据集时就不再使用,因此存在切分过于迅速的问题。ID3算法还不能处理连续性特征。下面简单介绍一下其他算法: CART 分类回归树 CART是Classification And Regerssion Trees的缩写,既能处理分类任务也能做回归任务。 CART
机器学习 —— 概率图模型(Homework: Exact Inference)
在前三周的作业中,我构造了概率图模型并调用第三方的求解器对器进行了求解,最终获得了每个随机变量的分布(有向图),最大后验分布(双向图)。本周作业的主要内容就是自行编写概率图模型的求解器。实际上,从根本上来说求解器并不是必要的。其作用只是求取边缘分布或者MAP,在得到联合CPD后,寻找联合CPD的最大值即可获得MAP,对每个变量进行边缘分布求取即可获得边缘分布。但是,这种简单粗暴的方法效率极其低下,对于MAP求取而言,每次得到新的
机器学习面试问题6
以下内容接机器学习面试问题5. 神经网络参数相关 参数的范围 目前还没有明确的参数范围,只有个人总结性的原则。如下: 网络参数确定原则: ①、网络节点 网络输入层神经元节点数就是系统的特征因子(自变量)个数,输出层神经元节点数就是系统目标个数。隐层节点选按经验选取,一般设为输入层节点数的75%。如果输入层有7个节点,输出层1个节点,那么隐含层可暂设为5个节点,即构成一个7-5-1 BP神经网络模型。在系统训练时,实际还要对不同的隐层
【网易】2018秋招笔试(机器学习算法岗)
1. 魔法币 DESCRIPTION 小易准备去魔法王国采购魔法神器,购买魔法神器需要使用魔法币,但是小易现在一枚魔法币都没有,但是小易有两台魔法机器可以通过投入x(x可以为0)个魔法币产生更多的魔法币。魔法机器1:如果投入x个魔法币,魔法机器会将其变为2x+1个魔法币魔法机器2:如果投入x个魔法币,魔法机器会将其变为2x+2个魔法币小易采购魔法神器总共需要n个魔法币,所以小易只能通过两台魔法机器产生恰好n个魔法币,小易需要你帮他设
机器学习之路: tensorflow 自定义 损失函数
git: https://github.com/linyi0604/MachineLearning/tree/master/07_tensorflow/ 1 import tensorflow as tf 2 from numpy.random import RandomState 3 4 ''' 5 模拟一个回归案例 6 自定义一个损失函数为: 7 当真实值y_更大的时候 loss = a
【机器学习基础】集成学习回顾及总结
之前有将集成学习中的随机森林、GBDT、XGBoost等算法进行一一介绍,明白了每个算法的大概原理,最近复习了一下李宏毅老师的集成学习的课程,忽然对集成有了更清晰的认识,这里做一个回顾和总结。 集成学习回顾及总结 集成学习从直观的意思来说,就是合众人之力来解决一个问题,而每个人所起的作用又不相同,最终把大家的力量进行“集成”,从而得到更优的方案。 在前面线性回归的误差分析中说到,误差来源于偏差bias和方差variance
使用MySQL的EXECUTE指令进行操作的方法和示例
MySQL的EXECUTE指令使用方法 MySQL的EXECUTE指令是用来执行一条或多条SQL语句的指令。它可以用来执行SQL语句,比如插入、更新、删除等操作,也可以用来执行存储过程。EXECUTE指令需要指定一个SQL语句或一个存储过程,并可以传入参数。 MySQL的EXECUTE指令示例 下面是一些使用EXECUTE指令的示例: EXECUTE INSERT INTO table_name (field1, field2, ...) VALUES (value1, value2, ..
CentOS7下卸载MySQL8的步骤和注意事项说明
CentOS7下卸载MySQL8步骤 1、停止MySQL服务:使用命令systemctl stop mysqld.service停止MySQL服务。 2、卸载MySQL服务:使用命令yum remove mysql-server卸载MySQL服务。 3、删除MySQL相关文件:使用命令rm -rf /var/lib/mysql删除MySQL的数据文件;使用命令rm -rf /etc/my.cnf删除MySQL的配置文件。 4、检查是否卸载成功:使用命令rpm -qa | grep mysql查
MySQL默认的事务隔离级别和其影响介绍
MySQL默认的事务隔离级别是REPEATABLE READ,它是一种可重复读取的隔离级别,它允许事务在它的生命周期内可重复读取相同的数据。它支持可重复读取,即在事务的生命周期内,不受其他事务的影响,可以多次读取相同的数据,但不能防止脏读,不可重复读取和虚读。 REPEATABLE READ的影响 阻止脏读:REPEATABLE READ可以阻止脏读,即一个事务读取另一个事务未提交的数据。 不可重复读取:REPEATABLE READ不能阻止不可重复读取,即一个事务多次读取同一行数据,但每次
【机器学习】李宏毅——Explainable ML(可解释性的机器学习)
本文介绍了Explainable ML(可解释性的机器学习)的相关内容,抱愧这项技术的相关概述、当前发展等等。 在前面的学习之中,我们已经学习了很多的模型,它能够针对特定的任务,接受我们的输入并产生目标的输出。但我们并不满足于此,我们甚至希望机器告诉我们,它是如何得到这个答案的,而这就是可解释的机器学习。 Why we need Explainable ML 首先我们要明确,即使我们训练出来的
MySQL如何打开可视化界面进行操作和管理
MySQL是一种关系型数据库管理系统,可以通过可视化界面进行操作和管理,让用户更加便捷地管理数据库。MySQL可视化界面的打开方法如下: 1. 下载安装MySQL可视化工具 用户需要到MySQL官网下载最新版本的MySQL可视化工具,安装完成后,就可以正常使用了。 2. 连接MySQL数据库 用户需要使用MySQL可视化工具连接MySQL数据库,可以使用本地数据库,也可以使用远程数据库。用户需要准备好MySQL数据库的IP地址、用户名和密码,输入到MySQL可视化工具中,点击连接,就可以成功连
使用Navicat实现MySQL数据导入的方法和注意事项
使用Navicat实现MySQL数据导入是一个比较常见的操作,它可以帮助用户快速将数据从本地文件导入MySQL数据库中。下面介绍。 1. 安装Navicat 需要安装Navicat,它是一款专业的MySQL数据库管理软件,可以帮助用户实现MySQL数据导入、导出、查询等功能。安装Navicat之后,可以打开Navicat,点击“文件”-“新建连接”,输入MySQL服务器的主机名、用户名和密码,即可连接到MySQL服务器。 2. 选择要导入的文件 点击“工具”-“数据传输”,点击“新建传输”,在