【多媒体】ffmpeg将webm格式转换成mp4
起因手头有一部4K风景视频,辛辛苦苦从油管上下载下来,想要用wallpaper engine做成壁纸,却发现格式是webm,vp9编码,wallpaper engine并不支持,所以想要将格式进行转换。怎么说呢,感觉还是ffmpeg更方便,就是参数很难调。所以在此记录一下。
转换成HEVC编码(H.265)因为是使用的硬件编码,硬件编码教程
1ffmpeg -c:v vp9_cuvid -i video.webm -c:v hevc_nvenc -cq 0 video.mp4
参数解释:
-c:v :指定编解码器
-i : 指定输入参数
vp9_cuvid : 使用nvdia硬件vp9解码器
hevc_enc: 使用nvdia硬件h.265编码器
-cq : 也就是软压的-crf参数很类似,控制码率的参数,0最低对应画质好,数字越大越差
转换之后发现wallpaper engine不支持hevc,麻了,而且码率输入进去的有20000K左右,出来只有2000K了,压得实在太狠了。
转换成AVC编码(h.264)考虑到想要无损编码,至少码率不要损失得太严重,所以找到了新的解决办法
...
【机器学习】自注意力
前言我们前面说过,注意力机制包含几个重要的参数,query,key,value,针对不同的问题,往往需要选择合适的变量来作为query,key,和value,当遇到query,key,value都是同一个东西,同一种参数的时候,这样的机制叫做自注意力机制。
1. 自注意力假设我们有一个输入序列
\mathbf{x}_{1}, \ldots, \mathbf{x}_{n}, \forall \mathbf{x}_{i} \in \mathbb{R}^{d}xi是第i个时间步的输入,d是输入值的特征维度,自注意力池化层将xi同时作为query,key,value,对序列抽取特征得到
\mathbf{y}_{1}, \ldots, \mathbf{y}_{n}其中
\mathbf{y}_{i}=f\left(\mathbf{x}_{i},\left(\mathbf{x}_{1}, \mathbf{x}_{1}\right), \ldots,\left(\mathbf{x}_{n}, \mathbf{x}_{n}\right)\right) \in \mathbb{R}^{d}xi作为qu ...
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment
【数据结构】基于PyQt5的Huffman编解码系统
最近布置的作业要整个编码压缩译码解压缩系统,唉真是难啊,临时花了几天看PyQt5,踩了无数坑,终于算是弄完了。
弄了动态背景,其实就是GIF图播放,计算任务是放在子线程里面的,任务进度在主线程UI界面更新。
参考博客:
Huffman编码:
基于哈夫曼编码的压缩算法的Python实现_字节莫的CSDN博客-CSDN博客_python 哈夫曼压缩
Python中使用哈夫曼算法实现文件的压缩与解压缩_cc815107613的博客-CSDN博客_python基于哈夫曼编码的文件压缩及解压缩
Pyqt5多线程:
pyqt5 的多线程(QThread)遇到的坑(一)_HHKJ 的博客-CSDN博客
pyqt5 的多线程(QThread)遇到的坑(二)_HHKJ 的博客-CSDN博客_pyqt多线程闪退
Pyqt5刷新页面:
pyqt5学习笔记——刷新页面_OneKey-CSDN博客_pyqt5 刷新界面
Pyqt5打包:
[PyQt] 使用.qrc 生成资源文件供程序中使用_的专栏-CSDN博客_pyqt 编译qrc文件
PyQt5,资源文件 .qrc 的使用_龚建波-CSDN博客_pyqt5 ...
【图像处理】MATLAB简单人脸检测
1.人脸检测原理框图
整体思路是寻找图片中最大的连通域,将其认定为人脸。
第一个环节均值滤波,是为了减弱图像的相关细节部分,以免毛刺影响后期连通域的形成,二值化方便形态学处理,减少运算量。考虑到人脸有黑人和白人黄种人,黑人肤色较深,在二值化之后面部区域不容易形成较大的连通域,如果采取形态学边界提取的办法,就可以避免这个问题,形态学边界提取,只要结构元素够大,也可以形成较大的封闭连通域。
然后就是纵向闭合操作,这一步我选择采用竖向长条状的结构元素进行闭合运算,因为人的脸部和颈部以及头发和衣物等等都是纵向分布的,在进行形态学边界提取的时候,容易将这些靠近的成分割裂开来,这对连通域的判断极为不利,所以用竖向长条状的结构元素在在纵向进行闭合运算,将脸部上下部的区域重新连接起来。
紧接着我又用横向长条状结构元素进行横向腐蚀运算,这是因为,人的头部以下的身体部分存在有大量连通域的时候,容易对最大连通域的判决产生干扰,又因为下半部分,多半呈纵向分布,通过横向腐蚀可以将这些大块的连通域割裂开来,但是要注意的是,割裂程度不应太大,否则会使得上一步闭合操作丧失意义。
接着,由于背景杂物等因素,同样也会产生 ...