每张图片自带BGM?牛津小哥开源神器,实现任意图像转换声谱图
liuian 2024-12-06 17:23 55 浏览
十三 发自 凹非寺
量子位 报道 | 公众号 QbitAI
给你一张图片,你能想象它的声音吗?
一个叫SpectroGraphic的神器就能做到这点。
例如,给定一个“怪物史莱克”的照片,通过这个工具,就能生成其对应的声谱图。
图像嵌入声谱图
大多数声音是许多声波的复杂组合,而每一种声波都有不同的频率和强度。
声谱图(spectrogram)是一种表示声音的方法,它的横轴是时间,纵轴是频谱。
△声谱图示例
而SpectroGraphic所做的工作就是获取一张图像,简单地把它解释成一张声谱图。
这样,就可以通过产生的声音,便将图像嵌入到了声谱图中。
是不是非常酷炫?
现在,项目已开源,每个人都可以体验了!
项目安装
首先,运行如下代码来获取命令行工具spectrographic:
pip?install?spectrographic也可以直接把stand-alone\文件夹里的spectrographic.py文件,作为命令行工具使用。
此外,还需要确保满足 requirements.txt 文件中涉及的所有依赖项。
可以通过如下命令来进行安装:
pip?install?requirements.txt在使用 pip 进行安装之后,只需要在控制台中运行 spectrographic […]。
在使用stand-alone脚本时,必须使用 python spectrographic.py […]。
还可以简单地从 SpectroGraphic.base 中导入 SpectroGraphic 类。
命令行工具的使用
usage:?spectrographic?[-h]?[--version]?-i?PATH_TO_IMAGE?[-d?DURATION]?[-m?MIN_FREQ]?[-M?MAX_FREQ]?[-r?RESOLUTION]?[-c?CONTRAST]?[-p]?[-s?SAVE_FILE]
Turn?any?image?into?sound.
optional?arguments:
??-h,?--help????????????show?this?help?message?and?exit
??--version?????????????show?program's?version?number?and?exit
??-i?PATH_TO_IMAGE,?--image?PATH_TO_IMAGE
????????????????????????Path?of?image?that?we?want?to?embed?in?a?spectrogram.
??-d?DURATION,?--duration?DURATION
????????????????????????Duration?of?generated?sound.
??-m?MIN_FREQ,?--min_freq?MIN_FREQ
????????????????????????Smallest?frequency?used?for?drawing?the?image.
??-M?MAX_FREQ,?--max_freq?MAX_FREQ
????????????????????????Largest?frequency?used?for?drawing?the?image.
??-r?RESOLUTION,?--resolution?RESOLUTION
????????????????????????Vertical?resolution?of?the?image?in?the?spectrogram.
??-c?CONTRAST,?--contrast?CONTRAST
????????????????????????Contrast?of?the?image?in?the?spectrogram.
??-p,?--play????????????Directly?play?the?resulting?sound.
??-s?SAVE_FILE,?--save?SAVE_FILE
????????????????????????Path?to?.wav?file?in?which?to?save?the?resulting?sound.如果你的源图像在./source.png,想要生成10s的音频,频率范围为10kHz到20kHz,还希望保存为sound.wav,最终还要播放音频。
那么就运行如下代码:
spectrographic?--image?./source.png?--min_freq?10000?--max_freq?20000?--duration?10?--save?sound.wav?--play如果你正在使用stand-alone脚本:
python?spectrographic.py?--image?./source.png?--min_freq?10000?--max_freq?20000?--duration?10?--save?sound.wav?--play作者简介
△右:Levi Borodenko
Levi Borodenko,目前在牛津大学攻读数学和统计学硕士学位。学术研究重点是随机分析和机器学习。
本科也就读于牛津大学,2017-2018担任PROMYS Oxford的辅导员,2018-2019年担任PROMYS Boston的首席辅导员。
更多开源项目可访问如下链接:
https://github.com/LeviBorodenko
传送门
项目地址:
https://github.com/LeviBorodenko/spectrographic
个人简介:
https://cv.levib.dev/
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关推荐
- win10关闭防火墙通知(win10关闭防火墙通知怎么关闭)
-
可以关闭防火墙win10提醒。因为win10自带的防火墙会有提醒功能,但有些用户会觉得这个提醒不必要,可以关闭。具体操作步骤是:右键点击Windows徽标,选择“Windows防火墙”,点击“高级设置...
- 微软公司介绍(微软公司介绍文案)
-
微软美国跨国科技公司微软(Microsoft)是一家美国跨国科技企业,1975年4月4日创立。2023财年营收2119.15亿美元,[200]公司总部设立在华盛顿州雷德蒙德(Redmond,邻近西雅图...
- 怎样设置电脑桌面密码(设置电脑桌面密码步骤)
-
首先,需要确定你是想设置电脑屏幕保护密码还是系统登录密码。如果是屏幕保护密码,可以在电脑设置中进行修改。打开控制面板,找到“个性化”或“外观和个性化”选项,再找到“屏幕保护器”选项,点击“设置”,在弹...
- 繁体字输入法下载(繁体字输入法下载安装)
-
你下载百度手机输入法,默认的就是双拼,可以自己选择26键拼音输入01打开苹果手机,找到苹果商城,02打开下载中心,搜索“搜狗输入法”,03下载搜狗输入法,04等下载完成后桌面上会显示搜狗输入法,05然...
- 国产操作系统概念股(国产操作系统概念股票)
-
那么怎么构建该系统呢?一般情况下都是从以下几个方面: 第一、选股方法。虽然靠着均线能选股,靠着指标也能选股,但是系统性的选股方法则是要结合宏观经济整体运行位置和环境,行业发展现状和前...
- 电脑主机开机没反应(电脑主机开机没反应电源灯亮)
-
操作方法01第一种情况是电脑完全没有反应,那么就可能是电源没有连接上,检查插线板和机箱插头,重新插好就好了。?02还有是电脑机箱已经开启,但是显示屏还是黑的,那么这种情况就有可能是显示屏的电源没有连接...
- cad激活码2010(cad激活码和序列号)
-
1.首先激活码出现问题,需要进行激活确认。首先需要的中进入电脑C盘。2.可以先点击组织设置隐藏文件夹显示。3.勾选显示隐藏文件夹。4.找到C:\ProgramData文件夹,打开找到CAD文件夹。5....
- 联想windows7笔记本怎么连接网络
-
检查笔记本的无线网卡驱动1.右键我的电脑,点击“属性”,选择左侧“设备管理器”2.点击“网络适配器”,如果方框内没有驱动,请下载驱动精灵万能网卡版安装网卡驱动 二、若发现驱动前面是感叹号的&...
- 淘宝电脑版网页入口(淘宝网电脑版网页官方)
-
网站地址:https://www.taobao.com/网站链接:进入网站服务器IP:116.253.191.241网站描述:淘宝网首页,淘宝网-亚洲最大、最安全的网上交易平台,提供各类服饰、美容...
- 大学生用哪个牌子的笔记本电脑好
-
荣耀MagicBook14英寸轻薄窄边框笔记本电脑(AMD锐龙58G512GFHDIPS正版Office)冰河银这款的性价比较高。也可以根据自己的预算选同系列其他型号。...
- 免费手机模拟器(免费手机模拟器下载)
-
目前能成功在电脑上模拟苹果系统的iOS模拟器,对比市面上常见的安卓模拟器少太多了,主要原因还是iOS系统比较封闭,难于开发。虽然前面说开发很困难,但是国内还是有一些厉害的IT小组成功推出了iOS模拟器...
- 新手怎么制作word表格(工作表格制作)
-
步骤如下:1、本次演示使用的软件为word文字处理软件,软件版本为Microsoftoffice家庭和学生版2016。2、首先打开Excel电子表格,根据问题描述,我们在word中插入两页表格。3、...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
