百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

「oeasy」python0020换行字符_feed_line_lf_反斜杠n_B语言_安徒生

liuian 2025-03-01 14:38 26 浏览

换行字符

回忆上次内容

  • struct包可以让我们使用封包格式
    • 把数字封包到字节里
      • pack函数负责封包
      • unpack函数负责解封
    • 我们通过封到不同的字节状态
      • 遍历了一次ascii码
  • 还是有那片黑色的区域
    • 好像是一片黑暗森林!
    • 那里面到底有些什么秘密?
  • 我们这次向黑暗森林区域进发!!
  • 整理行装
  • 出发!

chr

  • 先看看"oeasy"这个字符串是如何存在的
  • 字符都对应着一个数字
    • 数字在计算机上究竟是如何存储的呢?
    • 用二进制形式存储在字节中的
  • 可以看看这个二进制形式么?

chr

  • 8bit 构成 byte
  • 上图的字节为
    • (0011 0101)2
    • (35)16
    • 对应着字符'5'
  • 那字母呢?
  • abcd在内存里长什么样子?

文件编码

  • 编写一个文件
    • 写下 abcd
    • 用 :%!xxd
    • :%!xxd -r 变回来
  • 可以看到文件是用 2进制 方式存储的
    • 0x61 - a
    • 0x62 - b
    • 0x63 - c
    • 0x64 - d
  • 不论是内存、硬盘还是网络传输
    • a 对应
      • (0x61)16
      • (0b01100001)2
  • 图中最后的那个 0x0a 对应什么字符???

善用函数

  • 使用chr得到相关字符
  • 0x0a对应的是'\n'这个字符
  • 这个字符好像在哪里见过?

回到最初

  • 想要了解这个'\n'
    • 我们还得回到最初
  • 我们回到开始的时候
  • 前面介绍过
    • BWK写的 c 语言的第一个程序

\n

  • 注意到hello world后面的\n了么?
    • 注意到hello world后面的\n了么?
    • 特别注意斜杠的方向
      • 这个方向\叫反斜杠
        • 键盘位置在回车键附近
  • 那\n到底是什么??

输出"\n"

  • \n 是一个整体
    • 占一个字节
    • 算一个字符
    • 序号是(10)10进制
    • 也就是(0x0a)16进制
    • 这就是在开篇时的abcd后面的字符
    • \n在内存里显示为一个.
  • 我们直接把他输出看看

输出

  • 输出
#输出\n
print("\n")
#直接print
print()
#查看序号
ord("\n")
#查看十六进制的序号
hex(ord("\n"))
  • 输出结果
  • 好像换了 2 行
    • 如果没\n的话,只换 1 行
    • 如果有\n的话, 就换 2 行
  • 我们看看ascii码表是如何定义的这第10个字符的

找到位置

  • 我们已经身在在黑暗森林中
    • 找到了一个落脚点
  • 十进制的10 就是 十六进制的 0x0A
    • 这个数值在 ascii 码表中意思是 LF
  • 啥意思?

搜索

  • 搜索\n得到的结果是这样的
    • LF 意味着 Line Feed
    • 喂行
    • 喂一行纸
  • 那我真的可以用这个\n在字符中间换行嘛?

尝试换行

#输出字符串中带有\n
print("Hello\nWorld")
  • 在游乐场中尝试
  • 中途换行成功!
  • 可以多来几个换行符吗?

多来几个

  • 就往里面加\n
#输出字符串中带有\n
print("He\nllo\nWor\nld")
  • 显然这个 \n 就是一个换行
    • 字符串里面有个 \n 就意味着需要换 1 行
    • 他的英文是 Line Feed
    • 意思就是 新换1行
    • 这个东西其实比 ascii 的历史还要悠久
    • 从打字机的时代就有了
  • 为什么要有换行符呢?

换行符

  • 最最开始的时候分段落
    • 都是靠打字机输出空格完成换行
    • 自从有了这个LineFeed
    • 一个键就直接换行了
    • 所以LineFeed 极大地提高了效率
  • 两个换行符就换两行
  • 可以使用chr函数么?

使用序号得到换行符

#输出ascii值为10的字符
chr(10)
#把这个字符放在print里面输出
print("hello"+chr(10)+"world")
  • 纯文本中也会有回车符么?
  • 我们去看看纯文本文件

打开文本文档

https://github.com/overmind1980/oeasy-python-tutorial.git
vi oeasy-python-tutorial/samples/000016/anderson_fairy_tales.txt
  • 首先下载这个仓库
  • 然后找到其中的安德森仙话这个本书
  • 我们发现这个东西是318K
  • 那他有多少字符呢?

字符数量

  • 1个英文字符占一个字节
    • 318k大概有318000个字节
    • 大概是31.8万个字符
  • 这就是文本文件的形式
  • 第一行的Andersen后面有应该有两个换行符
  • 是不是呢真有换行符呢?

字节形式

  • 所有行转化为字节形式
    • %!xxd
  • 查找0a
    • /0a
  • 确实能够找到那两个换行符(0a)
  • 这可以和纯文本方式对应起来吗?

纯文本方式

  • 文本中的换行
    • 其实就是换行符的效果
  • 在文本观看模式下是换行
  • 在字节观看模式下是0a
  • 这本书后来被翻译成安徒生童话

安徒生童话

  • 里面有很多耳熟能详的故事
    • 《皇帝的新装》
    • 《海的女儿》
    • 《丑小鸭》
    • 《红舞鞋》
    • 《卖火柴的小女孩》
    • 《拇指姑娘》
  • 在安徒生所处的时代(1805-1875)
    • 丹麦仍是一个君主专制主义社会
    • 20年代经济衰退
    • 童话用儿童视角透视复杂生活
    • 万物有灵
    • 风趣幽默
  • Jean Hersholt
    • 将160个故事从丹麦文翻译成英文
  • 刘半农 1914年
    • 翻译了《皇帝的新衣》开始
  • 叶君健 1944年到1949年
    • 翻译了 安徒生童话全集
  • 互联网时代
    • 英文版安徒生童话被谷腾堡项目所收录

落实

  • 文档当中就是用0和1来表示字符的
  • 如下图所示
    • 文字是蓝色的
    • 字节是黑色的
  • 为什么\n会用来表示换行(Line-Feed)呢?

追溯历史

  • c语言 中的 \n 来自于什么呢?
    • 来自于 B语言
    • B语言 是里奇和汤普逊最早开发 unix 的语言
    • B语言 1969 年 就 运行在bell实验室 的 PDP-8 上
  • 1971 年里奇和汤普逊开始对于 B语言 进行改造
    • 在新买的 PDP-11 上用 B语言 给 B语言 写扩展,称之为 NewB
    • 1973 年 NewB 基本主体完成
      • 改名叫 c语言
    • 所以 c 其实是 NewB
  • 他们用手头的编译器和c语言给 PDP-11 重写了一个 Unix Kernel
    • 机器语言和汇编语言本来不具有移植性
    • 就像x86的二进制程序不能直接运行在arm上
    • 需要移植
  • c语言 程序却可以在 很多架构 的处理器上编译运行
    • 只要那种架构的处理器具有对应的 c语言编译器和库
    • 那就能顺利编译成针对该处理器架构的二进制程序
    • 甚至能实现跨平台编译
      • 也就是今天所说的交叉编译
    • 这就是 c语言 在当时能够发展的原因
  • c语言 源自 B语言
  • B语言 也不是凭空创造的
    • 源自什么呢?

Basic Combined Programming Language(BCPL)

  • B语言 源自BCPL(Basic Combined Programming Language)
    • 1967 年由剑桥大学的 Matin Richards 制作
  • 在同样由剑桥大学开发的 CPL语言 上改进而来
    • BCPL 最早被用做牛津大学的 OS6操作系统 上面的开发工具
  • 后来通过美国贝尔实验室的改进和推广成为了 UNIX 上的常用开发语言
    • 最早 BCPL 语言的样子就有个类似于l(ine)f(eed)的符号
    • 这是关于换行符表示法 最早的记录
    • 当时的换行符长什么样呢?

BCPL的换行符

  • 当时的换行符长成这样
    • !*n
  • 上述程序的目是
    • 输出 hello,world
    • 然后再来个回车
  • 所以hello world
    • 并不是c语言的发明
    • 而是从c语言的爷爷bcpl那时候就有了
    • 并且从bcpl时代就已经作为迷因(meme)开始传播
  • python虚拟机的可执行文件
  • 也就是pyc文件是如何理解换行符的呢?

反汇编(disassemble)

  • 观察一下
  • \n出现在字符串常量中
  • 能在pyc中找到这个常量么?

先编译

  • 将py文件编译成pyc文件
  • 再观察

pyc文件

  • 打开pyc文件
  • 确实能够找到a和s之间的\n
  • 也就是(0a)16进制
  • 任务完成!!!

总结

  • \n 就是换行符号
    • 换行符对应着 ascii 字符的代码是(10)10进制
    • 换行符的英文是 LF
    • 意思是Line Feed
  • 我们可以在《安徒生童话》的文本中
    • 找到每个字符对应的字节形态
  • 不光txt文件是文件
    • 我们的python游乐场本质上也是一个二进制可执行的文件
    • 这个文件在哪?
  • 我们可以读懂这个可执行文件吗?
  • 我们下次再说!
  • 蓝桥->https://www.lanqiao.cn/teacher/3584
  • github->https://github.com/overmind1980/oeasy-python-tutorial
  • gitee->https://gitee.com/overmind1980/oeasypython
  • 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...