线性回归:模型之母

线性回归模型看上去很简单,简单到让不少人觉得它并没有什么研究和使用的价值。其实并不是这样,线性回归可以说是最重要的数学模型之一,其他很多模型都建立在它的基础之上。为了更好地理解这一点,让我们先来看一个有关数学家的笑话。

一天,数学家觉得自己受够了数学,于是他跑到消防队去宣布他想当消防员。

消防队长说:“您看上去不错,可是我得先给您一个测试。”消防队长带数学家到消防队后院小巷,巷子里有一个货栈、一只消防栓和一卷软管。

消防队长问:“假设货栈起火,您怎么办?”

数学家回答:“我把消防栓接到软管上,打开水龙头,把火浇灭。”消防队长说:“完全正确!最后一个问题,假设您走进小巷,而货栈没有起火,您怎么办?”

数学家疑惑思索了半天,终于答道:“我就把货栈点着。”消防队长大叫起来:“什么?太可怕了!您为什么要把货栈点着?”

数学家回答:“这样我就把问题化简为一个我已经解决过的问题了。”

搭建模型的思路和笑话中数学家的思路一样。当遇到一个新问题时,总是考虑通过某种数学上的变换,将未知的问题转化为已知模型能解决的问题。所以任何一个复杂模型,一层层拨开来,里面可能藏着好多个线性回归模型。因此,线性回归模型很有研究的必要。深入了解它的模型细节能帮助我们理解其他模型,进而指引我们根据实际场景搭建有效的模型。

摘自:唐亘.精通数据科学:从线性回归到深度学习

Matplotlib的样式

今天粗略看了下scikit-learn文档,发现首先第一步需要弄清楚的是python的画图,也就是首先得面对matplot,打算先从matplot学起。在网上搜了下matplot画图的事例,发现比较散乱,不够系统,决定还是先跟着matplot的文档过一遍,然而,首先就面对了一个问题,因为原来用ggplot画图,对ggplot这个样式比较感兴趣,试了下ggplot样式,果然出现了想要的图形,但问题来了,当我测试文档中例子时,怎么都做不出文档中输出的图形,颜色不对,想改成默认的样式,但却不知道怎么改。搜索了很多之后,终于找到了解决的办法,用plt.rcdefaults()。

import matplotlib.pyplot as plt
plt.rcdefaults()

可以用下面符号改变图中标记的样式:

线的样式 描述
'-' 实线
'--' 杠线
'-.' 点杠线
':' 点线
颜色的样式 描述
'b' 蓝色
'g' 绿色
'r' 红色
'c' 青色
'm' 品红
'y' 黄色
'k' 黑色
'w' 白色
标记点的样式 描述
'.'
','
'o'
'v' 下三角
'^' 上三角
'<' 左三角
'>' 油三角
'1' 下三角
'2' 上三角
'3' 左三角
'4' 油三角
's' 方形
'p' 五边形
'*' 星形
'h' 六边形1
'H' 六边形2
'+' 加号
'x' 叉号
'D' 钻石
'd' 细钻石
'\|' 短竖线
'_' 短横线

matplotlib的颜色种类: