rknn-toolkit2/doc/changelog-1.5.0.txt

2023-5-18
版本: v1.5.0:
更新内容:
1. 更新config.dynamic_input的接口定义
2. 修复部分op属性获取失败的问题

2023-5-17
版本: v1.4.6b2:
更新内容:
1. 修复RK3562 多batch rknn模型C API运行错误的Bug。

2023-5-15
版本: v1.4.6b1:
更新内容:
1. 修复普通API多输入多输出模型动态shape出错的bug
2. 增加RK3562 Matmul API支持
3. 修复第一层为Reshape时dynamic_input失败的问题
4. 修复opset12~15可能存在的问题

2023-5-11
版本: v1.4.6b0:
更新内容:
1. 优化RKNN_FLAG_COLLECT_MODEL_INFO_ONLY初始化效率
2. 修复1x1x1x1两个feature Add算子转换Bug
3. 修复load_rknn加载老版本模型出错的兼容性问题
4. 添加opset13/14/15的部分支持 (试验性质)
5. 修复eval_perf导出csv时可能会报错的问题
6. 修复load_rknn报错问题
7. 添加非4维的ReduceXXX支持

2023-5-6
版本: v1.4.5b3:
更新内容:
1. 增加RKNN_MIN_TIMEOUT_MS环境变量设置NPU提交任务超时的阈值
2. 添加一维Where的支持
3. 修复大模型包含Constant节点报错的问题
4. 优化权重稀疏化的性能

2023-4-28
版本: v1.4.5b2:
更新内容:
1. 修复dynamic_input普通api结果错误问题
2. 修复非4维输入连板推理报错问题

2023-4-27
版本: v1.4.5b1:
更新内容:
1. 修复dynamic_input连板推理输出shape报错问题
2. 添加matmul前后transpose的消除规则, 并优化matmul性能
3. 修复大模型编译报错问题
4. 添加load_rknn的dynamic_input支持
5. 修复代码生产时resize出错的问题

2023-4-26
版本: v1.4.5b0:
更新内容:
1. [RK3562] 优化Transformer模型中的transpose/reshape多算子级联的性能
2. 增加后缀为.torchscript的pytorch文件格式支持

2023-4-25
版本: v1.4.4b5:
更新内容:
1. 修复dynamic_input在存在Reshape下的推理报错问题
2. 增加dynamic_input多轴动态支持
3. 更新cpp部署代码生成功能

2023-4-23
版本: v1.4.4b3:
更新内容:
1. 添加dynamic_input功能
2. 修复3维deconv报错问题
3. 更新大模型转换支持
4. 优化模拟器推理性能
5. 添加cpp部署代码生成功能
6. 修复load_rknn的推理问题

2023-4-14
版本: v1.4.3b12:
更新内容:
1. [RK3562]增加指定层跑CPU/GPU/NPU特性。
2. 修复concat优化规则
3. 添加op_target功能

2023-4-11
版本: v1.4.3b10:
更新内容:
1. 更新rknn编译器

2023-4-10
版本: v1.4.3b9:
更新内容:
1. 更新tensorflow QAT支持
2. 优化大模型的转换内存和性能
3. 修复图优化问题，并添加部分新规则
4. 修复mmse报错问题
5. 优化conv的拆分规则
6. 修复混合量化问题
7. 添加RMSNorm支持
8. load_onnx添加input_initial_val参数
9. 修复onnxoptimizer报错问题

2023-3-28
版本: v1.4.3b4:
更新内容:
1. 修复5维slice的问题

2023-3-27
版本: v1.4.3b3:
更新内容:
1. [RK3566]优化CNN+LSTM结构模型的内存。
2. 优化Concat性能
3. load_tflite/load_tensorflow添加input_is_nchw参数

2023-3-23
版本: v1.4.3b2:
更新内容:
1. mul/add/div/sub算子优化。
2. 修复多级maxpool量化问题

2023-3-21
版本: v1.4.3b1:
更新内容:
1. 修复Expand算子Bug

2023-3-21
版本: v1.4.3b0:
更新内容:
1. [RK3562]增加内部Buffer循环复用功能
2. [RK3562]优化多batch layerNorm算子精度
3. [RK3566]int8 Matmul CPU算子优化
4. [全平台]expand NPU OP支持
5. [全平台]fp16模型输入耗时优化
6. 完善Cast算子的支持
7. 修复remove_weight/多输入归一化参数匹配错误等Bug
8. 更新常量折叠支持
9. 更新eval_perf功能
10. 增加float16模型的支持
11. 优化常量共享的模型

2023-3-9
版本: v1.4.2b6:
更新内容:
1. RK3562平台Bug修复。
2. 增加model_pruning控制，并支持deconv，以及Bug修复
3. 增加If/Loop的部分转换支持
4. 修复MMSE部分模型失败的问题
5. 优化仿真器的结果
6. 增加python3.10的支持
7. 优化转换内存占用
8. 增加部分非4维Op支持

2023-2-15
版本: v1.4.2b1:
更新内容:
1. 修复RK3562查询的size_with_stride大小错误问题

2023-2-14
版本: v1.4.2b0:
更新内容:
1. 更新neg支持
2. 增加min/max的融合优化
3. 增加了RK3562平台支持

2023-2-8
版本: v1.4.1b23:
更新内容:
1. 修复特定stride反卷积算子的Bug。
2. 更新MatMul的perchannel量化支持
3. 更新动态图检测功能
4. 优化where的量化支持

2023-2-2
版本: v1.4.1b22:
更新内容:
1. 增加Equal算子对Bool类型支持。
2. 修复Matmul算子/exLayerNorm算子的Bug.
3. 更新equal/slice/cast/pad/ConvTranspose支持
4. 更新QAT模型支持
5. 移除bfloat16包依赖

2023-1-13
版本: v1.4.1b21:
更新内容:
1. 修复RK3588 Matmul接口错误。
2. 修复4通道输入float16类型模型在RK356X平台查询虚宽错误问题。
3. 模型不填写量化信息情况下，默认Tensor量化类型为float16。
4. 增加unk__xxx无效shape支持
5. 更新abs/dataconvert支持
6. 优化模型剪枝功能

2023-1-6
版本: v1.4.1b19:
更新内容:
1. [功能]增加Conv+Add+Relu子图融合。
2. 修复Conv+Add在量化参数不一致情况下融合的Bug。
3. 修复RK3588 大kernel卷积的Bug。
4. 增加模型剪枝功能
5. 优化Sigmoid的量化参数
6. 增加rk3562的支持

2022-12-17
版本: v1.4.1b17:
更新内容:
1. [优化]增加NPU输出NCHW数据支持。
2. [功能]增加conv+add+relu融合支持。
3. 修复最高维度非1模型MaxPool算子错误的Bug。
4. 修复最高维度非1模型首层Conv错误的Bug。
5. 修改4维npy的layout定义
6. 优化dataconvert/gather/transpose/mul/maxpool/sigmoid/pad/conv/relu/softmax支持
7. 增加aten::upsample_nearest2d支持
8. 修复仿真器在perchannel下可能的溢出问题
9. 增加更多的转换错误提示
10. 更新混合量化支持

2022-11-26
版本: v1.4.1b14:
更新内容:
1. 修复寄存器位宽限制警告。
2. 优化Concat CPU算子效率。
3. 增加2维layernorm支持
4. 更新MatMul支持

2022-11-19
版本: v1.4.1b13:
更新内容:
1. [重要]Android NDK编译器升级到r23b版本，APP建议使用该版本NDK重新编译。
2. LSTM结构更新升级，需要重新转换模型。
3. RK356X增加Transpose优化。
4. RK356X模型非对齐通道的float类型NCHW输出效率优化。
5. 增加常量输出节点删除功能
6. MMSE支持无法batch扩维的模型
7. 修复resize/clip缺失属性的问题
8. 增加swish/dataconvert/softmax/lstm/layernorm相关优化
9. 增加离群值检测功能
10. 优化非4维OP的性能

2022-11-01
版本: v1.4.1b12:
更新内容:
1.修复LSTM模型多次转换结果不一致问题。
2.改进onnx模型裁剪功能

2022-10-29
版本: v1.4.1b11:
更新内容:
1.修复Runtime外部分配内接口运行LSTM错误问题。
2.修复Runtime rknn_dup_context接口运行LSTM错误问题。
3.优化大模型转换性能
4.添加Loop/Scatter转换支持

2022-10-24
版本: v1.4.1b10:
更新内容:
1.修复LSTM兼容性问题。
2.修复RK3588输入自动填充虚宽值的重复运行错误的bug。
3.修复出现size=0的中间tensor刷cache失败的问题(模型需重新生成)。
4.增加IN、Swish非4维支持
5.添加tflite支持perchannel的QAT模型

2022-10-19
版本: v1.4.1b9:
更新内容:
1.修复RV1106 rknn_detroy接口内存泄漏问题。

2022-10-18
版本: v1.4.1b8:
更新内容:
1.修复非LSTM模型共享权重时rknn_init失败的bug。

2022-10-17
版本: v1.4.1b7:
更新内容:
1.修复RK3588分支合并后的bug。

2022-10-17
版本: v1.4.1b6:
更新内容:
1.修复大分辨率输入的bug。
2.优化无效pad

2022-10-13
版本: v1.4.1b5:
更新内容:
1.修复32-bit库matmul错误的bug。
2.添加FAQ文档
3.更新图优化规则
4.调节MatMul量化方式

2022-10-12
版本: v1.4.1b4:
更新内容:
1.修复LSTM共享权重失败问题。
2.更新图优化规则

2022-10-10
版本: v1.4.1b3:
更新内容:
1. LSTM寄存器配置内存占用的优化。
2. 优化MMSE量化算法
3. 优化KL量化算法

2022-9-30
版本: v1.4.1b2:
更新内容:
1. 关闭寄存器差量支持
2. 增加Batchnorm+Relu融合支持
3. 增加32-bit Runtime库Neon优化支持。
4. 优化rknn_init空初始化性能。
5. 更新精度分析功能
6. 修复QAT模型的hardsigmoid等问题
7. 修复lstm/gru图优化问题
8. 更新图优化规则

2022-9-14
版本: v1.4.1b1:
更新内容:
1. 增加寄存器差量支持
2. 修复lstm的bug

2022-9-14
版本: v1.4.1b0:
更新内容:
1. 增加rknn.config接口增加npu_do_output_nhwc配置，开启或关闭NPU直接输出NHWC的特性
2. 修复QAT模型解析问题


------------------------------------------------------------
2022-8-20
版本: v1.4.0:
更新内容:
1. 升级相关依赖包到主流版本
2. 添加更多2/3/5维度的Op支持
3. 更新config/init_runtime等接口
4. 更新LSTM等Op支持
5. 添加yuv输入支持
6. 更新QAT模型支持

2022-7-2
版本: v1.3.4b5:
更新内容:
1. rknn-toolkit2:
    1) optimize_onnx接口
        a. 在设置optimization_level=2时，关闭conv+add融合。
        b. 保留BatchNormalize算子带的量化参数。
    2) RK3588屏蔽NPU直接输出NHWC layout的支持， RK3566/RV1106保留该功能。
2.  C API:
    1) RK3588/RK3566/RV1106支持传入一个包含rknn模型的大文件路径，rknn_init接口设置包含偏移和真实rknn模型大小的rknn_init_extend结构体指针。


------------------------------------------------------------
2021-4-22
版本: v1.3.0:
更新内容:
1. 新功能: python3.8/ubuntu20.04 平台支持
2. 修复一些已知的bug:
    1) 修复了一些图优化和量化bug

2021-4-7
版本: v1.2.5:
更新内容:
1. 新功能: rv1103/rv1109平台的支持.
2. 修复一些已知的bug:
    1) 修复了一些QAT模型转换问题
    2) 修复了一些图优化bug


2021-1-27
版本: v1.2.1-beta:
更新内容:
1. 新功能: 多batch的NHWC格式输入时,在H维度,有效元素个数与实际内存中的元素个数不一致时,支持H方向实际元素个数按照h_stride设置.
2. 修复一些已知的bug:
    1) LSTM算子内部变量重名的问题.


------------------------------------------------------------
2021-1-12
版本：v1.2.0
更新内容:
1. 新功能: rk3588平台的支持; rknn模型加密支持; tensorflow/tflite/pytorch量化感知模型支持; 增加了一些新的 op 支持: InstanceNormalization, Swish, Conv1D等（详见 op support list）；增加了参数量计算以及算力分析
2. examples 更新：增加了从 pytorch 转 onnx 的转换 demo：resnet18_export_onnx ；增加了pytorch量化感知模型的加载demo：resnet18_qat demo；增加了模型加密功能：添加了3588平台 rknn 转换 demo
3. 接口更改：移除了 config，load_caffe，load_tensorflow等接口的一些不必要的参数设置，更新了 eval_perf 接口，详细改动见Uer_Guide文档
4. 修复一些已知的bug:
    1) 修复了一些模型无法转换rknn的问题
    2) 修复了一些图优化bug
    3) 修复了一些模型推理结果错误的问题
    4) 修复了 pytorch、tflite 某些 op 转换失败的问题
5. 优化: 精度分析耗时优化; 模型转换和量化耗时优化


------------------------------------------------------------
2021-8-12
版本：v1.1.0
更新内容:
1. 新功能: LSTM，GRU的支持；增加了accuracy_analysis对比项目；增加了一些op支持：caffe hardswish；onnx gather,reduceMax等op；更新了更全面的图优化规则。
2. examples更新：增加了yolov5的demo
3. 修复一些已知的bug：
    1）修复了一些模拟器的推理结果错误问题
    2）修复了一些图优化bug
    3）修复了一些大模型无法转换rknn的问题
    4）修复了多输入的转换和推理bug
4. 更新了文档，更新了OP支持列表

2021-6-30
版本：v1.1.0beta
更新内容:
1. 新功能: 混合量化功能(支持自定义是否量化以及量化参数修改)；完善了 accuracy_analysis 对比功能（包括连板对比结果)
2. examples更新：增加了常用接口的demo示例：accuracy_analysis、batch_size、hybrid_quant、load_quantized_model、mmse、multi_input_test
3. 修复一些已知的bug：
    1）修复了一些int8/fp16模型的转换问题以及op精度问题
    2）修复了一些图优化bug，修复了一些依赖的版本问题
4. 更新了文档，更新了OP支持列表


------------------------------------------------------------
2021-4-30
版本：v1.0.0
更新内容:
1. 新功能: 卷积类的per channel量化功能；添加了config中custom_inf的模型信息设置、img_quant_RGB2BGR设置；添加了eval performance的性能测试接口；增加了版本打印功能
2. OP支持：1) 添加了Caffe新OP支持：Power/Tile/Eltwise(Max)/去除了normalize维度的限制; 2) 添加了onnx新OP支持:HardSigmoid/Pow/Tile
3. 修复一些已知的bug：
    1) 修复了caffe FC的输出shape以及name的错误
    2) 优化了mmse的量化性能
    3）修复caffe的Pooling层的输出shape计算错误
    4）修复了caffe slice丢弃了其中一个输出的inference bug
    5）修复了一些模型优化的bug
4. 弃置了reorder_channel的config设置，由用户自行保证inference输入数据的channel正确性
5. 更新了文档，更新了OP支持列表


------------------------------------------------------------
2021-4-2
版本：v0.7.0
更新内容:
1. 新功能: 新的量化算法支持(mmse), 添加支持tensorflow的预量化模型导入
2. 添加了Caffe新OP支持：relu6/ConvolutionDepthwise/Transpose/reorg
3. 修复一些已知的bug:
    1) 增加concat的非channel维度，非4维输入的支持
    2) 修复了第一层是scale的预处理bug
    3）更新了onnxruntime==1.7.0的版本
4. 更新了文档，更新了OP支持列表


------------------------------------------------------------
2021-3-1
版本：v0.6.0
更新内容:
1. 新功能: caffe load API添加指定输入name的接口；添加了caffe lrn(WithinChannel)的支持
2. 添加了Caffe新OP支持：crop/flatten/normalize/proposal/reduction
3. 添加了onnx/pytorch/tensorflow/darknet/tflite新OP支持
4. 移除了aciq以及Kl散度量化功能
5. 修复一些已知的bug:
    1) 最后一层是reshape转换bug；
    2) 修复了caffe中InnerProduct随机生成blob的bug；
    3) 修复了过大的size导致GlobalAvgPool GlobalMaxPool crash的问题;
    4) 修复了第一层是RoIpooling的维度错误；
    5) 修复了SSD设备端推理错误的问题等。
6. 更新了文档，增加了OP支持列表