学习笔记1—python基础

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

1、安装pip: python -m pip install -U pip （打开命令行窗口：Anaconda Prompt）
升级：python -m pip install --upgrade pip (相关用法：https://pip.pypa.io/en/latest/user_guide/#installing-from-wheels) 查询已经安装的包：pip list 如果“pip install 工具包名称”安装不上，那就下载目标软件到安装目录下的pkgs, 然后通过Anaconda Prompt命令窗口进入该路径下，再输入“pip install 工具包名称”命令进行安装。
2、安装nilearn: pip install -U --user nilearn （打开命令行窗口：Anaconda Prompt）
卸载： pip uninstall [options] <package> 或 pip uninstall [options] -r <requirements file>
3、python:
import scipy
[r,p] = scipy.stats.pearsonr(x,y):表示求x和y的pearson相关
pd.read_excel('motion_parameters_all.xls')#读取excel文件
4、路径正确的表示以及导入.mat文件：
如果运行时报错：mat4py模块不存在 ----> 在anaconda prompt终端中，输入该命令：pip install mat4py
import mat4py as mt
in_path = 'F:/BrainAging/SDSU/test/Results/mat_in_20.mat'
data_ext = mt.loadmat(ex_path)
5、注意: python中 numpy.empty() 该函数表示生成一个随机矩阵
6、查询矩阵维度：numpy.shape(mat)
7、'/'和'//'区别：前者表示浮点除，后者则表示整除
8、构建矩阵：
from numpy import *
matri_data = mat('1 2 3; 2 3 2')
9、生成随机矩阵：arr = np.arange(10)
10、获取向量y某个维度的长度：y.shape[m],其中m代表获取第几维度，
11、idx_set = set(range(5))得到的结果：{0, 1, 2, 3, 4, 5}--->相当于matlab中的cell
12、清空变量：reset（快捷键: ctrl+L）
13、选中对应的行 (1)快捷键组合为ctrl键和[键：ctrl+[ 或者(2)快捷键组合为ctrl键和]键：ctrl+]
14、x[1,2]的shape值(2,)，意思是一维数组，数组中有2个元素；y[[1],[2]]的shape值是(2,1)，意思是一个二维数组，每行有1个元素；z [[1,2]]的shape值是（1，2），意思是一个二维数组，每行有2个元素。
15、生成空的矩阵：mat = None; 生成空的list： list = []
16、两种类型的相互转换函数： 1）array转list：a = a.tolist() ；2）list转array：a =np.array(a) 17、1）list.append(list1)，是将list1作为一个数据项、一个元素，追加在list中；2）list.extend(list1)，是将list1与list相连接。 18、找到矩阵中最值，并返回行和列：re = np.where(results == np.min(results[1:80,1:80]))，使用x == np.max(x) 获得一个掩模矩阵，然后使用where方法即可返回最大值对应的行和列。 where返回一个长度为2的元组，第一个元素保存的是行号，第二个元素保存的是列号。
19、单引号和双引号的区别在于，前者需要转义字符，后者不需要；eg. s1 = ' let\'s go '; s2 = "let's go";
20、1个双引号和三个双引号区别在于，前者换行需要转义字符，后者不需要, 而且三个双引号可以有注释;
eg. s3 = "hello \ s4 = """ hello
world" world """
21、三个双引号和三个单引号区别，在于看字符中是否包含单引号字符，如果有，则用三个双引号。
22、a = np.array([[1, 2], [3, 4]])
>>> np.mean(a) # 将上面二维矩阵的每个元素相加除以元素个数（求平均数）--->2.5
>>> np.mean(a, axis=0) # axis=0，计算每一列的均值 ----> array([ 2., 3.])
>>> np.mean(a, axis=1) # 计算每一行的均值 ----> array([ 1.5, 3.5])
23、取绝对值：abs() 24、如何导入一个项目：关于python的集成开发环境有很多种，比如PyCharm，Spyder等。楼主在初学python时使用的是Spyder，在打开项目时遇到一点小问题，记录一下解决方法。。首先在想试用Spyder新建项目时，习惯性的选择了工具栏中的“File”，紧接着就可以看到有一个“New file...”，但显然，这样只能创建一个文件，而不是想要的项目。

之后仔细查看，会发现在同样在工具栏，有独立的一个“Projects”，就可以创建项目了...

接下来关于打开项目，在使用Scrapy框架创建爬虫后，发现不能顺利打开项目，会遇到“XXX is not a Spyder project!"

对比使用Spyder创建的项目以及自己没有使用Spyder创建的项目，会发现在第一级目录下，Spyder创建的项目多一个.spyproject文件夹，打开后是四个配置文件，想必问题就出在这里了。将这个文件夹放置于自己没有使用Spyder创建的项目的一级目录下，就可以顺利打开自己的项目了。

参考原文：https://blog.csdn.net/VeastLee/article/details/79698566

25、python 里 np.array 的shape ( ,)与( ,1)的区别

>>> import numpy as np
>>> x = np.array([1, 2])
>>> y = np.array([[1],[2]])
>>> z = np.array([[1,2]])
>>> print(x.shape)
(2,)
>>> print(y.shape)
(2, 1)
>>> print(z.shape)
(1, 2)

x[1,2]的shape值(2,)，意思是一维数组，数组中有2个元素

y[[1],[2]]的shape值是(2,1)，意思是一个二维数组，每行有1个元素

z [[1,2]]的shape值是（1，2），意思是一个二维数组，每行有2个元素

参考原文：https://blog.csdn.net/weixin_39449570/article/details/78645618

26、mean, (std)用法：
import numpy as np
num1 = np.array([[1,2,3],[2,3,4],[3,4,5],[4,5,6]])
now2 = np.mat(num1)
now2
matrix([[1, 2, 3],
        [2, 3, 4],
        [3, 4, 5],
        [4, 5, 6]])
np.mean(now2) # 对所有元素求均值
3.5
np.mean(now2,0) # 压缩行，对各列求均值
matrix([[ 2.5, 3.5, 4.5]])
np.mean(now2,1) # 压缩列，对各行求均值
matrix([[ 2.],
        [ 3.],
        [ 4.],
        [ 5.]])原文：https://blog.csdn.net/taotiezhengfeng/article/details/72397282
27、python中的 np.tile()相当于 np.repmat()
28、返回格式：return (sel_fea, fea_num)
29、生成随机数：np.random.randn(n_samples)
30、将类别二值化：y = label_binarize(y, classes=[0, 1, 2])
31、生成随机噪声：
# Add noisy features to make the problem harder
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X = np.c_[X, random_state.randn(n_samples, 200 * n_features)]
32、Python与MATLAB中 data(j,:) 等价 y_score[[j],:]
33、spyder中让生成的图像单独在窗口中显示：
1）生成图像在窗口中单独显示的命令：%matplotlib空格qt 在python3的版本中是qt5
2)生成图像在命令行中单独显示的命令：%matplotlib空格inline
34、矩阵的转置：data = data.T
35、python将nan, inf转为特定的数字：
import numpy as np
a = np.array([[np.nan, np.nan, 1, 2], [np.inf, np.inf, 3, 4], [1, 1, 1, 1], [2, 2, 2, 2]])
where_are_nan = np.isnan(a)
where_are_inf = np.isinf(a)
a[where_are_nan] = 0
a[where_are_inf] = 0
36、将list中某一个元素赋值给变量：a = list[5]
37、np.round([3.00,4.00,5.2]) ----> [3,4,5]
38、a.astype(np.int)---->将数组a里面数据类型修改为整数型
39、读出路径的上级，上上级目录：

#当前文件的路径

pwd = os.getcwd()

#当前文件的父路径

father_path=os.path.abspath(os.path.dirname(pwd)+os.path.sep+".")

#当前文件的前两级目录

grader_father=os.path.abspath(os.path.dirname(pwd)+os.path.sep+"..")

40、python中np.where类似于Matlab中find函数: idx = np.where(a > 2)
41、元组转数组：index = np.array(indx) %indx是元组类型数据
42、数组取特定index的值：
1）y[0:59,]（此处y的数据类型是一维数组，float，（107，））
43、通过shuffle打乱数据：from sklearn.utils import shuffle；df = shuffle(df)；
44、通过np.delete删除矩阵特定的行(axis = 0)，列(axis = 1)：X = np.delete(X,(0,1,2,3,4,5,6,7,8,9,10),axis = 0)
45、非零元素个数: print(len(a.nonzero(Y)[0]))
46、非零元素的值：print(a[a.nonzero(Y)[0]])
47、用python怎么读取mat文件的三维矩阵

# coding=utf-8

import scipy.io as sio

import numpy as np

data = sio.loadmat(r'C:\Users\xiligey\Desktop\C3.mat') # 把这个路径改成你的mat路径即可

print('scipy读取三维矩阵的初步结果: \n%s\n' % data)

result = data['C']

print('提取出其中的三维数组: \n%s' % result)

48、读取mat文件并存为npy格式文件，代码如下：
import numpy as np
import scipy.io as sio
mat = np.load('F:/coupling_FC_SC_ASD/child_adol/toConsesusNet_stru/adol_SCN_asd_group_binary.npy')
sio.savemat('adol_SCN_asd_group_binary.mat',{'adol_SCN_asd_group_binary':mat})

49、在这里我们介绍两个拼接数组的方法：np.vstack():在竖直方向上堆叠； np.hstack():在水平方向上平铺