03-11 01:45 阅读 174

tensorflow常见API

Tensorflow

与图相关的API位于tf.Graph类中：

tf.Operation类代表图中的一个节点，用于计算张量数据：

tf.Tensor类是操作输出的符号句柄，它不包含操作输出的值，提供一种在tf.session中的计算方法：

可视化：tf.summary,FileWriter类用于在目录中创建事件文件，并且向文件中添加摘要和事件，用来在Tensorboard中展示：

常见API：

1. tf.global_variables_initializer()

初始化计算图中所有全局变量（op）

2. tf.local_variables_initializer()

用来初始化计算图中所有局部变量（op）

3. tf.summary.scalar(tags, values, collections=None, name=None)

用来显示标量信息，一般在画loss,accuary时会用到这个函数

如：tf.summary.scalar(‘mean‘, mean)

4. tf.summary.histogram(tags, values, collections=None, name=None)

用来显示直方图信息，一般用来显示训练过程中变量的分布情况

如：tf.summary.histogram(‘histogram‘, var)

5. tf.summary.distribution

分布图，一般用于显示weights分布

6. tf.summary.merge_all()

将所有summary全部保存到磁盘，以便tensorboard显示

如：tf.summaries.merge_all(key=‘summaries‘)

7. tf.summary.merge(inputs, collections=None, name=None)

一般选择要保存的信息还需要用到tf.get_collection()函数

tf.summary.merge(inputs, collections=None, name=None)

8. tf.summary.text

可以将文本类型的数据转换为tensor写入summary中

9. tf.summary.image(tag, tensor,max_images,collections=None,name=None)

输出带图像的probuf，汇总数据的图像的的形式如下： ‘ tag /image/0‘, ‘ tag /image/1‘...，如：input/image/0等

tf.summary.image(tag, tensor, max_images=3, collections=None, name=None)

10. tf.summary.audio

展示训练过程中记录的音频

11. tf.summary.FileWriter

指定一个文件用来保存图

tf.summary.FileWritter(path,sess.graph)

12. tf.gfile.Copy(oldpath, newpath, overwrite=False)

拷贝源文件并创建目标文件，无返回

13. tf.gfile.MkDir(dirname)

创建一个目录，dirname为目录名字，无返回

14. tf.gfile.Remove(filename)

删除文件，filename即文件名，无返回

15. tf.gfile.DeleteRecursively(dirname)

递归删除所有目录及其文件，dirname即目录名，无返回

16. tf.gfile.Exists(filename)

判断目录或文件是否存在，filename可为目录路径或带文件名的路径，有该目录则返回True，否则False

17. tf.gfile.Glob(filename)

查找匹配pattern的文件并以列表的形式返回，filename可以是一个具体的文件名，也可以是包含通配符的正则表达式

18. tf.gfile.IsDirectory(dirname)

判断所给目录是否存在，如果存在则返回True，否则返回False，dirname是目录名

19. tf.gfile.ListDirectory(dirname)

罗列dirname目录下的所有文件并以列表形式返回，dirname必须是目录名

20. tf.gfile.MakeDirs(dirname)

以递归方式建立父目录及其子目录，如果目录已存在且是可覆盖则会创建成功，否则报错，无返回

21. tf.gfile.Rename(oldname, newname, overwrite=False)

重命名或移动一个文件或目录，无返回

22. tf.gfile.Stat(filename)

返回目录的统计数据，该函数会返回FileStatistics数据结构

23. tf.gfile.Walk(top, in_order=True)

递归获取目录信息生成器，top是目录名，in_order默认为True指示顺序遍历目录，否则将无序遍历，每次生成返回如下格式信息(dirname, [subdirname, subdirname, ...], [filename, filename, ...])

24. tf.gfile.GFile(filename, mode)

获取文本操作句柄，类似于python提供的文本操作open()函数，filename是要打开的文件名，mode是以何种方式去读写，将会返回一个文本操作句柄，tf.gfile.Open()是该接口的同名，可任意使用其中一个

25. tf.gfile.FastGFile(filename, mode)

该函数与tf.gfile.GFile的差别仅仅在于“无阻塞”，即该函数会无阻赛以较快的方式获取文本操作句柄

26. tf.train.Saver()

保存和恢复都需要实例化一个tf.train.Saver

27. tf.saved_model.utils.build_tensor_info(tensor)

使用SignatureDef方法，构建tensor info，将输入输出tensor的信息都进行了封装，并且给他们一个自定义的别名

{‘input_x‘: tf.saved_model.utils.build_tensor_info(x), ‘keep_prob‘: tf.saved_model.utils.build_tensor_info(keep_prob)}

.saved_model.signature_def_utils.build_signature_def(inputs, outputs, method_name )

使用SignatureDef方法，构建signature

tf.saved_model.signature_def_utils.build_signature_def(inputs, outputs, ‘test_sig_name‘)

29. tf.placeholder(dtype,shape=None,name=None)

用于构建graph的时候在模型中的占位，在执行session的时候再赋具体的值

30. tf.get_variable(name，shape，dtype，initializer,trainable)

此函数用于定义图变量。获取已经存在的变量，如果不存在，就新建一个

tf.get_variable(name=‘var1‘,shape=[1],initializer=None,dtype=tf.float32)

31. tf.Variable(initial_value，optional_name)

此函数用于定义图变量，生成一个初始值为initial_value的变量。

tf.Variable(tf.random_normal(shape[4,3],mean=0,stddev=1),name=‘v1‘)

.contrib.layers.xavier_initialize(uniform=True,seed=None,dtype=tf.float32 )

该函数返回一个用于初始化权重的初始化程序 Xavier，这个初始化器是用来保持每一层的梯度大小都差不多相同。

uniform: 使用uniform或者normal分布来随机初始化；

seed: 可以认为是用来生成随机数的seed；

dtype: 只支持浮点数；

tf.contrib.layers.xavier_initializer(uniform=False,dtype=tf.float32)

33. tf.constant_initializer()

初始化为常数，这个非常有用，通常偏置项就是用它初始化的

tf.constant_initializer(0.0)

34. tf.concat(values,axis,name=‘concat‘)

连接两个矩阵的操作，axis必须是数，表明在哪一维上连接

t1 = [[1, 2, 3], [4, 5, 6]] #这是一个2*3的矩阵t2 = [[7, 8, 9], [10, 11, 12]] #2*3tf.concat([t1, t2], 0) ==> [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]tf.concat([t1, t2], 1) ==> [[1, 2, 3, 7, 8, 9], [4, 5, 6, 10, 11, 12]]

35. tf.nn.embedding_lookup

选取一个张量里面索引对应的元素，即按照ids顺序返回params中的第ids行。换而言之，从id(索引)找到对应的One-hot encoding，然后非零节点的weight就直接对应了输出节点的值(注意这里没有activation function)，也就是对应的embedding向量

tf.nn.embedding_lookup(embedding, input_ids)

.gather(params, indices, validate_indices=None, name=None, axis=0)

按照指定的索引集合从axis中抽取子集，适合抽取不连续区域的子集

input = [[[1, 1, 1], [2, 2, 2]],[[3, 3, 3], [4, 4, 4]],[[5, 5, 5], [6, 6, 6]]]tf.gather(input, [0, 1], axis=0) = [[[1, 1, 1], [2, 2, 2]],[[3, 3, 3], [4, 4, 4]]]tf.gather(input, [0, 1], axis=1) = [[[1, 1, 1], [2, 2, 2]],[[3, 3, 3], [4, 4, 4]],[[5, 5, 5], [6, 6, 6]]]tf.gather(input, [0, 1], axis=2) = [[[1, 1], [2, 2]],[[3, 3], [4, 4]],[[5, 5], [6, 6]]]

37. tf.slice(input_, begin, size, name=None)

按照指定的下标范围抽取连续区域的子集

同tf.gather

38. tf.reshape(tensor,shape,name=None)

将tensor变换为参数shape形式，shape若有-1标识缺省值

tf.reshape(t, [2,2,3])，tfreshape(t,[-1,4,3])

39. tf.tile( input, multiples, name=None )

用于在同一维度上的复制

tf.tile(input, [2,2])

40. tf.layers.dense(

inputs,

units,

activation=None,

use_bias=True,

kernel_initializer=None,

bias_initializer=tf.zeros_initializer(),

kernel_regularizer=None,

bias_regularizer=None,

activity_regularizer=None,

kernel_constraint=None,

bias_constraint=None,

trainable=True,

name=None,

reuse=None

)

添加全连接层

inputs：输入该网络层的数据

units：输出的维度大小，改变inputs的最后一维

activation：激活函数，即神经网络的非线性变化

use_bias：使用bias为True（默认使用），不用bias改成False即可，是否使用偏置项

kernel_initializer：卷积核的初始化器

bias_initializer : 偏置项的初始化器，默认初始化为0

kernel_regularizer: 卷积核的正则化，可选

bias_regularizer: 偏置项的正则化，可选

activity_regularizer: 输出的正则化函数

trainable: 表明该层的参数是否参与训练。如果为真则变量加入到图集合中

tf.layers.dense(inputs=pool3, units=1024, activation=tf.nn.relu)

41. tf.sequence_mask(lengths, maxlen=None, dtype=tf.bool, name=None)

返回一个表示每个单元的前N个位置的mask张量

lengths：整数张量，其所有值小于等于maxlen；

maxlen：标量整数张量，返回张量的最后维度的大小；默认值是lengths中的最大值；

dtype：结果张量的输出类型；

name：操作的名字；

tf.sequence_mask([1, 3, 2], 5) => # [[True, False, False, False, False], # [True, True, True, False, False], # [True, True, False, False, False]]

42. tf.expand_dims(input, axis=None, name=None, dim=None)

在第axis位置增加一个维度

43. tf.ones_like( tensor, dtype=None, name=None, optimize=True )

给定一个张量（tensor），此操作返回与所有元素设置为1的张量相同的类型和形状的张量

44. tf.where(condition, x=None, y=None, name=None)

返回值是对应元素，condition中元素为True的元素替换为x中的元素，为False的元素替换为y中对应元素

x=[[1,2,3],[4,5,6]]y=[[7,8,9],[10,11,12]]condition=[[True,False,False, [False,True,True]]tf.where(condition,x,y)=[[ 1,8,9],[10,5,6]]

45. tf.nn.softmax(logits, axis=None, name=None, dim=None)

通过Softmax回归，将logistic的预测二分类的概率的问题推广到了n分类的概率的问题

tf.nn.softmax(x)

.matmul(a,b,transpose_a=False, transpose_b=False, adjoint_a=False, adjoint_b=False, a_is_sparse=False, b_is_sparse=False, name=None)

将矩阵a乘以矩阵b，生成a * b

a: 一个类型为 float16, float32, float64, int32, complex64, complex128 且张量秩 > 1 的张量。

b: 一个类型跟张量a相同的张量。

transpose_a: 如果为真, a则在进行乘法计算前进行转置。

transpose_b: 如果为真, b则在进行乘法计算前进行转置。

adjoint_a: 如果为真, a则在进行乘法计算前进行共轭和转置。

adjoint_b: 如果为真, b则在进行乘法计算前进行共轭和转置。

a_is_sparse: 如果为真, a会被处理为稀疏矩阵。

b_is_sparse: 如果为真, b会被处理为稀疏矩阵。

47. tf.multiply(x, y, name=None)

两个矩阵中对应元素各自相乘，注意：两个相乘的数必须有相同的数据类型，不然就会报错

48. tf.reduce_mean(input_tensor, axis=None, keep_dims=False, name=None, reduction_indices=None)

input_tensor：输入的待降维的tensor;

axis：指定的轴，如果不指定，则计算所有元素的均值;

keep_dims：是否降维度，设置为True，输出的结果保持输入tensor的形状，设置为False，输出结果会降低维度;

name：操作的名称;