Python Scipy的使用
稀疏矩阵
Python中一般会使用numpy.ndarray来保存矩阵数据,但是存在这样一种矩阵,它的长和宽都很大,然而其中有非常多0的元素存在。直接使用ndarray来保存数据,会带来巨大的资源浪费。在这种情况下,我们可以设计一种方法只保存非0的元素以此来实现压缩。
Python中一般会使用numpy.ndarray来保存矩阵数据,但是存在这样一种矩阵,它的长和宽都很大,然而其中有非常多0的元素存在。直接使用ndarray来保存数据,会带来巨大的资源浪费。在这种情况下,我们可以设计一种方法只保存非0的元素以此来实现压缩。
通常来说,一个Python文件(*.py)只能使用Python解释器完全的执行,而使用Jupyter Notebook运行Notebook文件的话(*.ipynb)就可以一块一块代码段运行,但是VSCode对Jupyter的支持比较弱,一个替代方法是Python文件里添加特殊的注逝。
Jupyter Cell生成的内容(字符串)没有直接复制的选项,要想实现复制的话,需要首先使用光标选中内容,然后将光标拖出去,即离开Jupyter Notebook打印内容的窗口,然后按下Ctrl + C即可实现内容的复制。
本篇记录了,macOS在使用中的一些问题和对应的解决办法
1 | export HOMEBREW_NO_AUTO_UPDATE=1 |
1 | sudo killall coreaudiod # Mac视频无法播放 |
1 | killall Dock vscode # 在程序坞消失 |
1 | plt.hist(arr, bins=20) |
1 | plt.figsize((10, 10)) |
假设你想画两个折线图,需要在图上反映出每一条折线所代表的含义
1 | plt.plot(x1, label = "x1") |
你需要在同一张图里花两条折线来分析它们的相关性
1 | from matplotlib import pyplot as plt |
1 | import seaborn as sns |
某些时候在使用机器学习模型之前,我们需要将数据进行归一化或者标准化的操作,下面给出这两种数据变化方式的定义。
1 | 1., -1., 2.], X_train = np.array([[ |
1 | from sklearn import preprocessing |
我们一般使用train_test_split来进行训练集和测试集的划分,这里有几个重要参数
key point
如何在训练集、测试集划分以后保留index?
方法:train_test_split前面的参数可以看作是一个array list,一般情况下我们会传入data_X,data_y,数据在
打乱划分以后还是保留着顺序对应关系的,根据这个原理,我们可以手动的构建一个索引array(通过np.arange)。这个
index array也会变成train index和test index
1 | from sklearn.model_selection import train_test_split |
这篇文章将会介绍如何从源码开始安装PostgreSQL,PostgreSQL有很多的安装方法,但是使用源码从头安装,用户可以控制选项参数,也可以选择自己想要的版本。总体来看PostgreSQL使用源码安装还是比较简单的。下面是对各个步骤的具体介绍