一种用于神经网络的多级存内查找表计算方法和装置与流程
未命名
07-20
阅读:72
评论:0

1.本发明涉及智能电子设备图像显示技术领域,具体为一种用于神经网络的多级存内查找表计算方法和装置。
背景技术:
2.当下,智能电子设备输出显示图像时,时常存在色彩偏差较大、失真程度高的问题,作为人工智能发展的基石,神经网络算法凭借其强大的自我学习能力,可用来模拟人脑分析和处理复杂的图像信息数据,在人脸识别、命名实体识别和签名验证等场景下都有广泛的应用,提升了智能电子设备输出图像内容的准确性。但神经网络算法的数据量和运算量相当庞大,因此,可通过存内计算(processing in memory,以下简称pim)的方式优化神经网络的运算过程,降低神经网络计算过程中的数据搬运量,从而提高系统能效。然而,已有的pim架构仅支持存内矩阵向量乘运算,只能用于神经网络的卷积层与全连接层计算。
3.而随着注意力网络等新型神经网络算法技术的发展,矩阵向量乘之外的非线性计算在神经网络中计算量占比显著提升,传统pim架构的计算性能严重受损,成为当下亟待优化的难题。
4.随着人工智能设备在视觉领域的快速发展,神经网络算法成为实现视觉信息处理的重要手段之一,存内计算架构是提高神经网络的处理性能与计算能效的重要途径。传统的pim在存储器电路阵列中高效完成神经网络的矩阵计算,但是在不改变已有电路架构的前提下,难以实现神经网络中非线性函数计算。
5.故如何有效使pim做非线性函数运算,同时减少了查找表计算误差,提升计算精度,优化查找表资源消耗,使查找表运转始终保持低功耗、高性能的状态,进而极大优化智能电子设备的色彩校准、图像色彩空间的转换和特殊色彩效果的计算性能,是当下亟需解决的阶段性难题。
技术实现要素:
6.(一)解决的技术问题
7.针对现有技术的不足,本发明提供了一种用于神经网络的多级存内查找表计算方法和装置,解决了上述背景技术中提出的问题。
8.(二)技术方案
9.为实现以上目的,本发明通过以下技术方案予以实现:一种用于神经网络的多级存内查找表计算方法,包括以下步骤:
10.s1、主控cpu从自外部传感器接收数据,并将输入数据存储至数据缓存单元;
11.s2、数据缓存单元将接收到的数据传输至矩阵计算模块,矩阵计算模块采用存内逻辑计算单元,完成矩阵向量乘、向量求和等计算;
12.s3、矩阵计算模块将数据计算完成后,将计算完成的数据反馈至数据缓存单元内,对计算完成的数据临时存储;
13.s4、数据缓存单元将矩阵计算模块计算完成的数据传输至多级查找表模块,多级查找表模块使用一级查找表、二级查找表直至n级查找表内的存内查找表单元完成非线性函数计算,直至算出结果;
14.s5、多级查找表模块将计算完成的结果传输至数据缓存单元内,再由数据缓存模块反馈至主控cpu内。
15.优选的,所述s2中包括以下子步骤:
16.1)、矩阵计算模块利用存内矩阵计算单元中的行解码器对接收到的数据进行解码,并通过控制单元将解码后的数据传输至存储阵列中;
17.2)、多路选择器选择处存储阵列中的阵列数据,并传输至存内逻辑计算单元中对阵列数据进行逻辑计算;
18.3)、存内逻辑计算单元将阵列数据的计算结果反馈至数据缓存单元,由数据缓存单元传输至多级查找表模块中。
19.优选的,所述s4中包括以下子步骤:
20.a、一级查找表、二级查找表直至n级查找表通过查找表配置电路,将输入数据对应的输出数据事先写入ram;
21.b、存内输入至地址映射电路会先将输入数据转换为查找表地址;
22.c、地址编码器将转换的查找表地址解码,并将解码数据发送至查找表子单元;
23.d、查找表子单元读出解码数据,通过结果读出电路输出,反馈至数据缓存单元,再由数据缓存单元反馈至主控cpu中。
24.优选的,所述s2步骤和s4步骤的顺序可互为调换。
25.一种用于神经网络的多级存内查找表计算装置,应用上述任意一项所述的一种用于神经网络的多级存内查找表计算方法,包括:
26.主控cpu,所述主控cpu用于自外部传感器接收数据,并将输入数据存储至数据缓存单元;
27.数据缓存单元,所述数据缓存单元用于架构主控cpu、矩阵计算模块以及多级查找表模块之间进行数据通信;
28.矩阵计算模块,所述矩阵计算模块对数据进行阵列、逻辑计算,完成矩阵向量乘、向量求和等计算;
29.多级查找表模块,所述多级查找表模块使用使用一级查找表、二级查找表直至n级查找表内的多个存内查找表单元完成非线性函数计算
30.优选的,所述矩阵计算模块内设置有多组存内矩阵计算单元,所述存内矩阵计算单元包括控制单元、行解码器、存储阵列、多路选择器以及存内逻辑计算单元,所述控制单元用于控制行解码器对数据缓存单元传输至矩阵计算模块内的数据进行解码,所述存储阵列用于对解码后的数据进行阵列存储,所述多路选择器用于旋转存储阵列内阵列存储的数据进行选择,通过存内逻辑计算单元对数据进行逻辑计算。
31.优选的,所述多级查找表模块包括一级查找表、二级查找表直至n级查找表,所述多级查找表模块通过一级查找表、二级查找表、直至n级查找表的多组查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率,所述一级查找表、二级
查找表直至n级查找表内均设置有多组存内查找表单元,所述存内查找表单元用于进一步分解多级运算,所述存内查找表单元包括存内输入至地址映射电路、地址编码器、查找表配置电路、查找表子单元以及结果读出电路,所述存内输入至地址映射电路用于先将输入数据转换为查找表地址,所述地址编码器用于将转换的查找表地址解码,所述查找表配置电路用于对查找表进行配置电路,所述查找表子单元用于读取解码数据,所述结果读出电路用于输出解码数据。
32.(三)有益效果
33.本发明提供了一种用于神经网络的多级存内查找表计算方法和装置。具备以下有益效果:
34.1、本发明通过设计一套存内查找表计算方法和装置,用于处理神经网络中非线性函数等非矩阵向量乘运算,设计存内查找表,采用并行计算与串行计算结合的电路架构,高效实现基于分段逼近法的多维嵌套查找表,从而实现激活函数与池化函数等非线性函数计算。
35.2、本发明有效解决了pim做非线性函数运算的难题,同时减少了查找表计算误差,提升了计算精度,优化了查找表资源消耗,使查找表运转始终保持低功耗、高性能的状态,极大优化了智能电子设备的色彩校准、图像色彩空间的转换和特殊色彩效果的计算性能。
36.3、本发明通过多级存内查找表电路,用pim实现激活函数与池化函数等非线性函数的计算,使神经网络函数的运算速度大幅加快的同时,保证了存内计算数据搬移功耗低的特点,减少了计算误差,提高了计算精度,有效提升了神经网络函数运算性能。
37.4、本发明解决了智能拍摄设备在视觉感知领域的计算性能难题,可用于智能拍摄的调色、滤镜等需要色彩校准及图像色彩空间转换的应用场景。
附图说明
38.图1为本发明的总流程示意图其一;
39.图2为本发明的子流程示意图;
40.图3为本发明的子流程示意图;
41.图4为本发明的总系统示意图;
42.图5为本发明的矩阵计算模块系统示意图;
43.图6为本发明的存内矩阵计算单元系统示意图;
44.图7为本发明的多级查找模块系统示意图;
45.图8为本发明的存内查找表单元系统示意图;
46.图9为本发明的总流程示意图其二。
47.其中,1、主控cpu;2、数据缓存单元;3、矩阵计算模块;4、多级查找表模块;5、存内矩阵计算单元;6、控制单元;7、行解码器;8、存储阵列;9、多路选择器;10、存内逻辑计算单元;11、一级查找表;12、二级查找表;13、n级查找表;14、存内查找表单元;15、存内输入至地址映射电路;16、地址编码器;17、查找表配置电路;18、查找表子单元;19、结果读出电路。
具体实施方式
48.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
49.实施例一:
50.如图1-8所示,本发明实施例提供一种用于神经网络的多级存内查找表计算方法,包括以下步骤:
51.s1、主控cpu1从自外部传感器接收数据,并将输入数据存储至数据缓存单元2;
52.s2、数据缓存单元2将接收到的数据传输至矩阵计算模块3,矩阵计算模块3采用存内逻辑计算单元10,完成矩阵向量乘、向量求和等计算;
53.s3、矩阵计算模块3将数据计算完成后,将计算完成的数据反馈至数据缓存单元2内,对计算完成的数据临时存储;
54.s4、数据缓存单元2将矩阵计算模块3计算完成的数据传输至多级查找表模块4,多级查找表模块4使用一级查找表11、二级查找表12直至n级查找表13内的存内查找表单元14完成非线性函数计算,直至算出结果;
55.s5、多级查找表模块4将计算完成的结果传输至数据缓存单元2内,再由数据缓存模块反馈至主控cpu1内。
56.s2中包括以下子步骤:
57.1)、矩阵计算模块3利用存内矩阵计算单元5中的行解码器7对接收到的数据进行解码,并通过控制单元6将解码后的数据传输至存储阵列8中;
58.2)、多路选择器9选择处存储阵列8中的阵列数据,并传输至存内逻辑计算单元10中对阵列数据进行逻辑计算;
59.3)、存内逻辑计算单元10将阵列数据的计算结果反馈至数据缓存单元2,由数据缓存单元2传输至多级查找表模块4中。
60.s4中包括以下子步骤:
61.a、一级查找表11、二级查找表12直至n级查找表13通过查找表配置电路17,将输入数据对应的输出数据事先写入ram;
62.b、存内输入至地址映射电路15会先将输入数据转换为查找表地址;
63.c、地址编码器16将转换的查找表地址解码,并将解码数据发送至查找表子单元18;
64.d、查找表子单元18读出解码数据,通过结果读出电路19输出,反馈至数据缓存单元2,再由数据缓存单元2反馈至主控cpu1中。
65.本发明采用存内逻辑计算电路实现查找表核心的输入至地址映射功能,将地址映射的运算由主控cpu1下发至多级查找表模块4内每一个一级查找表11、二级查找表12直至n及查找表内,显著提高地址映射的计算并行度、降低主控cpu1与查找表之间的数据传输,有效提高查找表的计算性能。
66.由于神经网络参数量与计算量巨大,使用一级查找表11进行计算面临查找表规模激增引起的性能损失问题。针对该问题,本发明提出多级存内查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率。以两级分解为例,下式展示了采
用输入规模m1与m2的查找表替代原有输入规模为m的查找表(,1,m2《《m)的理论方案:
[0067][0068]
h(
…
)与g(
…
)为输入规模是m1,m2的查找表
[0069]
一种用于神经网络的多级存内查找表计算装置,应用上述任意一项的一种用于神经网络的多级存内查找表计算方法,包括:
[0070]
主控cpu1,主控cpu1用于自外部传感器接收数据,并将输入数据存储至数据缓存单元2;
[0071]
数据缓存单元2,数据缓存单元2用于架构主控cpu1、矩阵计算模块3以及多级查找表模块4之间进行数据通信;
[0072]
矩阵计算模块3,矩阵计算模块3对数据进行阵列、逻辑计算,完成矩阵向量乘、向量求和等计算;
[0073]
多级查找表模块4,多级查找表模块4使用使用一级查找表11、二级查找表12直至n级查找表13内的多个存内查找表单元14完成非线性函数计算。
[0074]
矩阵计算模块3内设置有多组存内矩阵计算单元5,存内矩阵计算单元5包括控制单元6、行解码器7、存储阵列8、多路选择器9以及存内逻辑计算单元10,控制单元6用于控制行解码器7对数据缓存单元2传输至矩阵计算模块3内的数据进行解码,存储阵列8用于对解码后的数据进行阵列存储,多路选择器9用于旋转存储阵列8内阵列存储的数据进行选择,通过存内逻辑计算单元10对数据进行逻辑计算。
[0075]
多级查找表模块4包括一级查找表11、二级查找表12直至n级查找表13,多级查找表模块4通过一级查找表11、二级查找表12、直至n级查找表13的多组查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率,一级查找表11、二级查找表12直至n级查找表13内均设置有多组存内查找表单元14,存内查找表单元14用于进一步分解多级运算,存内查找表单元14包括存内输入至地址映射电路15、地址编码器16、查找表配置电路17、查找表子单元18以及结果读出电路19,存内输入至地址映射电路15用于先将输入数据转换为查找表地址,地址编码器16用于将转换的查找表地址解码,查找表配置电路17用于对查找表进行配置电路,查找表子单元18用于读取解码数据,结果读出电路19用于输出解码数据。
[0076]
本发明通过设计一套存内查找表计算方法和装置,用于处理神经网络中非线性函数等非矩阵向量乘运算,设计存内查找表,采用并行计算与串行计算结合的电路架构,高效实现基于分段逼近法的多维嵌套查找表,从而实现激活函数与池化函数等非线性函数计算。
[0077]
本发明有效解决了pim做非线性函数运算的难题,同时减少了查找表计算误差,提升了计算精度,优化了查找表资源消耗,使查找表运转始终保持低功耗、高性能的状态,极大优化了智能电子设备的色彩校准、图像色彩空间的转换和特殊色彩效果的计算性能。
[0078]
本发明通过多级存内查找表电路,用pim实现激活函数与池化函数等非线性函数的计算,使神经网络函数的运算速度大幅加快的同时,保证了存内计算数据搬移功耗低的特点,减少了计算误差,提高了计算精度,有效提升了神经网络函数运算性能。
[0079]
本发明解决了智能拍摄设备在视觉感知领域的计算性能难题,可用于智能拍摄的
调色、滤镜等需要色彩校准及图像色彩空间转换的应用场景。
[0080]
实施例二:
[0081]
如图2-9所示,本发明实施例提供一种用于神经网络的多级存内查找表计算方法,包括以下步骤:
[0082]
s1、主控cpu1从自外部传感器接收数据,并将输入数据存储至数据缓存单元2;
[0083]
s2、数据缓存单元2将矩阵计算模块3计算完成的数据传输至多级查找表模块4,多级查找表模块4使用一级查找表11、二级查找表12直至n级查找表13内的存内查找表单元14完成非线性函数计算,直至算出结果;
[0084]
s3、矩阵计算模块3将数据计算完成后,将计算完成的数据反馈至数据缓存单元2内,对计算完成的数据临时存储;
[0085]
s4、数据缓存单元2将接收到的数据传输至矩阵计算模块3,矩阵计算模块3采用存内逻辑计算单元10,完成矩阵向量乘、向量求和等计算;
[0086]
s5、多级查找表模块4将计算完成的结果传输至数据缓存单元2内,再由数据缓存模块反馈至主控cpu1内。
[0087]
s4中包括以下子步骤:
[0088]
1)、矩阵计算模块3利用存内矩阵计算单元5中的行解码器7对接收到的数据进行解码,并通过控制单元6将解码后的数据传输至存储阵列8中;
[0089]
2)、多路选择器9选择处存储阵列8中的阵列数据,并传输至存内逻辑计算单元10中对阵列数据进行逻辑计算;
[0090]
3)、存内逻辑计算单元10将阵列数据的计算结果反馈至数据缓存单元2,由数据缓存单元2传输至多级查找表模块4中。
[0091]
s2中包括以下子步骤:
[0092]
a、一级查找表11、二级查找表12直至n级查找表13通过查找表配置电路17,将输入数据对应的输出数据事先写入ram;
[0093]
b、存内输入至地址映射电路15会先将输入数据转换为查找表地址;
[0094]
c、地址编码器16将转换的查找表地址解码,并将解码数据发送至查找表子单元18;
[0095]
d、查找表子单元18读出解码数据,通过结果读出电路19输出,反馈至数据缓存单元2,再由数据缓存单元2反馈至主控cpu1中。
[0096]
本发明采用存内逻辑计算电路实现查找表核心的输入至地址映射功能,将地址映射的运算由主控cpu1下发至多级查找表模块4内每一个一级查找表11、二级查找表12直至n及查找表内,显著提高地址映射的计算并行度、降低主控cpu1与查找表之间的数据传输,有效提高查找表的计算性能。
[0097]
由于神经网络参数量与计算量巨大,使用一级查找表11进行计算面临查找表规模激增引起的性能损失问题。针对该问题,本发明提出多级存内查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率。以两级分解为例,下式展示了采用输入规模m1与m2的查找表替代原有输入规模为m的查找表(m1,m2《《m)的理论方案:
[0098]
[0099]
g(
…
)与g(
…
)为输入规模是m1,m2的查找表
[0100]
一种用于神经网络的多级存内查找表计算装置,应用上述任意一项的一种用于神经网络的多级存内查找表计算方法,包括:
[0101]
主控cpu1,主控cpu1用于自外部传感器接收数据,并将输入数据存储至数据缓存单元2;
[0102]
数据缓存单元2,数据缓存单元2用于架构主控cpu1、矩阵计算模块3以及多级查找表模块4之间进行数据通信;
[0103]
矩阵计算模块3,矩阵计算模块3对数据进行阵列、逻辑计算,完成矩阵向量乘、向量求和等计算;
[0104]
多级查找表模块4,多级查找表模块4使用使用一级查找表11、二级查找表12直至n级查找表13内的多个存内查找表单元14完成非线性函数计算。
[0105]
矩阵计算模块3内设置有多组存内矩阵计算单元5,存内矩阵计算单元5包括控制单元6、行解码器7、存储阵列8、多路选择器9以及存内逻辑计算单元10,控制单元6用于控制行解码器7对数据缓存单元2传输至矩阵计算模块3内的数据进行解码,存储阵列8用于对解码后的数据进行阵列存储,多路选择器9用于旋转存储阵列8内阵列存储的数据进行选择,通过存内逻辑计算单元10对数据进行逻辑计算。
[0106]
多级查找表模块4包括一级查找表11、二级查找表12直至n级查找表13,多级查找表模块4通过一级查找表11、二级查找表12、直至n级查找表13的多组查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率,一级查找表11、二级查找表12直至n级查找表13内均设置有多组存内查找表单元14,存内查找表单元14用于进一步分解多级运算,存内查找表单元14包括存内输入至地址映射电路15、地址编码器16、查找表配置电路17、查找表子单元18以及结果读出电路19,存内输入至地址映射电路15用于先将输入数据转换为查找表地址,地址编码器16用于将转换的查找表地址解码,查找表配置电路17用于对查找表进行配置电路,查找表子单元18用于读取解码数据,结果读出电路19用于输出解码数据。
[0107]
本发明通过设计一套存内查找表计算方法和装置,用于处理神经网络中非线性函数等非矩阵向量乘运算,设计存内查找表,采用并行计算与串行计算结合的电路架构,高效实现基于分段逼近法的多维嵌套查找表,从而实现激活函数与池化函数等非线性函数计算。
[0108]
本发明有效解决了pim做非线性函数运算的难题,同时减少了查找表计算误差,提升了计算精度,优化了查找表资源消耗,使查找表运转始终保持低功耗、高性能的状态,极大优化了智能电子设备的色彩校准、图像色彩空间的转换和特殊色彩效果的计算性能。
[0109]
本发明通过多级存内查找表电路,用pim实现激活函数与池化函数等非线性函数的计算,使神经网络函数的运算速度大幅加快的同时,保证了存内计算数据搬移功耗低的特点,减少了计算误差,提高了计算精度,有效提升了神经网络函数运算性能。
[0110]
本发明解决了智能拍摄设备在视觉感知领域的计算性能难题,可用于智能拍摄的调色、滤镜等需要色彩校准及图像色彩空间转换的应用场景。。
[0111]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以
理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
技术特征:
1.一种用于神经网络的多级存内查找表计算方法,其特征在于,包括以下步骤:s1、主控cpu(1)从自外部传感器接收数据,并将输入数据存储至数据缓存单元(2);s2、数据缓存单元(2)将接收到的数据传输至矩阵计算模块(3),矩阵计算模块(3)采用存内逻辑计算单元(10),完成矩阵向量乘、向量求和等计算;s3、矩阵计算模块(3)将数据计算完成后,将计算完成的数据反馈至数据缓存单元(2)内,对计算完成的数据临时存储;s4、数据缓存单元(2)将矩阵计算模块(3)计算完成的数据传输至多级查找表模块(4),多级查找表模块(4)使用一级查找表(11)、二级查找表(12)直至n级查找表(13)内的存内查找表单元(14)完成非线性函数计算,直至算出结果;s5、多级查找表模块(4)将计算完成的结果传输至数据缓存单元(2)内,再由数据缓存模块反馈至主控cpu(1)内。2.根据权利要求1所述的一种用于神经网络的多级存内查找表计算方法,其特征在于,所述s2中包括以下子步骤:1)、矩阵计算模块(3)利用存内矩阵计算单元(5)中的行解码器(7)对接收到的数据进行解码,并通过控制单元(6)将解码后的数据传输至存储阵列(8)中;2)、多路选择器(9)选择处存储阵列(8)中的阵列数据,并传输至存内逻辑计算单元(10)中对阵列数据进行逻辑计算;3)、存内逻辑计算单元(10)将阵列数据的计算结果反馈至数据缓存单元(2),由数据缓存单元(2)传输至多级查找表模块(4)中。3.根据权利要求1所述的一种用于神经网络的多级存内查找表计算方法,其特征在于,所述s4中包括以下子步骤:a、一级查找表(11)、二级查找表(12)直至n级查找表(13)通过查找表配置电路(17),将输入数据对应的输出数据事先写入ram;b、存内输入至地址映射电路(15)会先将输入数据转换为查找表地址;c、地址编码器(16)将转换的查找表地址解码,并将解码数据发送至查找表子单元(18);d、查找表子单元(18)读出解码数据,通过结果读出电路(19)输出,反馈至数据缓存单元(2),再由数据缓存单元(2)反馈至主控cpu(1)中。4.根据权利要求1所述的一种用于神经网络的多级存内查找表计算方法,其特征在于,所述s2步骤和s4步骤的顺序可互为调换。5.根据权利要求1所述的一种用于神经网络的多级存内查找表计算装置,应用于权利要求1-3中任意一项所述的一种用于神经网络的多级存内查找表计算方法,其特征在于,包括:主控cpu(1),所述主控cpu(1)用于自外部传感器接收数据,并将输入数据存储至数据缓存单元(2);数据缓存单元(2),所述数据缓存单元(2)用于架构主控cpu(1)、矩阵计算模块(3)以及多级查找表模块(4)之间进行数据通信;矩阵计算模块(3),所述矩阵计算模块(3)对数据进行阵列、逻辑计算,完成矩阵向量乘、向量求和等计算;
多级查找表模块(4),所述多级查找表模块(4)使用使用一级查找表(11)、二级查找表(12)直至n级查找表(13)内的多个存内查找表单元(14)完成非线性函数计算。6.根据权利要求5所述的一种用于神经网络的多级存内查找表计算装置,其特征在于,所述矩阵计算模块(3)内设置有多组存内矩阵计算单元(5),所述存内矩阵计算单元(5)包括控制单元(6)、行解码器(7)、存储阵列(8)、多路选择器(9)以及存内逻辑计算单元(10),所述控制单元(6)用于控制行解码器(7)对数据缓存单元(2)传输至矩阵计算模块(3)内的数据进行解码,所述存储阵列(8)用于对解码后的数据进行阵列存储,所述多路选择器(9)用于旋转存储阵列(8)内阵列存储的数据进行选择,通过存内逻辑计算单元(10)对数据进行逻辑计算。7.根据权利要求5所述的一种用于神经网络的多级存内查找表计算装置,其特征在于,所述多级查找表模块(4)包括一级查找表(11)、二级查找表(12)直至n级查找表(13),所述多级查找表模块(4)通过一级查找表(11)、二级查找表(12)、直至n级查找表(13)的多组查找表设计架构,将原计算分解为多级运算,不同级之间以流水的方式串行执行,同一级内不同查找表单元并行计算,可以在降低硬件成本的同事显著提高查找表计算的吞吐率,所述一级查找表(11)、二级查找表(12)直至n级查找表(13)内均设置有多组存内查找表单元(14),所述存内查找表单元(14)用于进一步分解多级运算,所述存内查找表单元(14)包括存内输入至地址映射电路(15)、地址编码器(16)、查找表配置电路(17)、查找表子单元(18)以及结果读出电路(19),所述存内输入至地址映射电路(15)用于先将输入数据转换为查找表地址,所述地址编码器(16)用于将转换的查找表地址解码,所述查找表配置电路(17)用于对查找表进行配置电路,所述查找表子单元(18)用于读取解码数据,所述结果读出电路(19)用于输出解码数据。
技术总结
本发明提供一种用于神经网络的多级存内查找表计算方法和装置,涉及智能电子设备图像显示技术领域。该用于神经网络的多级存内查找表计算方法和装置,包括以下步骤:S1、主控CPU从自外部传感器接收数据;S2、数据缓存单元将接收到的数据传输至矩阵计算模块;S3、矩阵计算模块将数据计算完成后;S4、数据缓存单元将矩阵计算模块计算完成的数据传输至多级查找表模块。本发明有效解决了PIM做非线性函数运算的难题,同时减少了查找表计算误差,提升了计算精度,优化了查找表资源消耗,使查找表运转始终保持低功耗、高性能的状态,极大优化了智能电子设备的色彩校准、图像色彩空间的转换和特殊色彩效果的计算性能。和特殊色彩效果的计算性能。和特殊色彩效果的计算性能。
技术研发人员:杨越
受保护的技术使用者:北京苹芯科技有限公司
技术研发日:2023.03.10
技术公布日:2023/7/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/