day03_09编码部分历史及文件编码简介

darkalex001 darkalex001     2022-09-18     555

关键词:

详细课件:http://www.cnblogs.com/alex3714/articles/5465198.html

字符编码

支持中文的第一张表就是GB2312

1980 gb2312 6700+

1995 gbk1.0 20000

2000 gb18030 27000

big5 台湾

unicode 万国码 支持所有国家和地区的编码

2^16 =  65535 = 存一个字符 统一占用2个字节

 

为了解决字符字节翻倍的问题,出现了UTF-8

UTF-8 = unicode 的扩展及,可变长的字符编码集

 

ASSIC==>GB2312==>GBK1.0==>GB18030

ASSIC==>UNICODE==>UTF-8

 

python3.0默认编码是nuicode支持中文

python2.0默认编码默认是ASSIC

 

如果用python2执行以下代码会报错,因为不支持中文,所以需要加上一行红色代码,终于搞懂为什么不需要在python3中加上这行代码了

#!-*- coding:utf-8 -*-
print "我爱北京天安门!"

windows默认编码是GBK,所以看UTF-8就看不了,所以出现以上错误乱码

 

解决方法:2种类

#!-*- coding:gbk -*-
print "我爱北京天安门!"

但是如果你使用notepad++的话,默认是utf-8,所以还需要转换一下才行

所以最好不要使用notepad++这个恶心的编辑器...这个编辑器最大的问题就是编码问题,fuck notepad++

因为unicode是向下兼容gb2312的,所以以下代码前加上u,就是可以直接显示中文了

#!-*- coding:utf-8-*-
print  u"我爱北京天安门"

  

另外一种编码的写法

#coding:utf-8
print  "我爱北京天安门"

 

把cmd编码还原成GBK格式,在cmd命令行中输入chcp 936

 

day03-字符编码与转换

1、编码常识在python2中默认编码是 ASCII,而在python3中默认编码是 unicodeunicode 分为utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节),所以utf-16是最常用的unicode版本,但是在文件里存的还是utf-8,因为utf8省空间在pyt... 查看详情

day-3小知识点补充编码集合文件及函数初识

...符    2.单个元素乘以数字不能超过21 2.编码字符:看到内容的最小单位。比如:   & 查看详情

day03_用户群组权限及正文处理命令

一.用户、群组和权限用户及passwd文件/etc/passwd文件的功能:存储所有用户的相关信息,该文件也被称为用户信息数据库(Database)/etc/passwd文件每个字段的具体含义a)第1个字段(列)记录的是这个用户的名字(在创建用户时root用户... 查看详情

day47:html(简介及常用标签)

...Language,HTML)通过标签语言来标记要显示的网页中的各个部分。一套规则,浏览器认识的规则。浏览器按顺序渲染网页文件,然后根据标记符解释和显示内容。但需要注意的是,对于不同的浏览器,对同一标签可能会有不完全相... 查看详情

day47:html(简介及常用标签)

...Language,HTML)通过标签语言来标记要显示的网页中的各个部分。一套规则,浏览器认识的规则。浏览器按顺序渲染网页文件,然后根据标记符解释和显示内容。但需要注意的是,对于不同的浏览器,对同一标签可能会有不完全相... 查看详情

day2_数字类型_字符串类型_列表类型_元组_字典_集合_字符编码_文件处理

数字类型:作用:年纪,等级,薪资,身份证号等;10进制转为2进制,利用bin来执行。10进制转为8进制,利用oct来执行。10进制转为16进制,利用hex来执行。#整型age=10print(type(age))#浮点salary=3000.3print(type(salary))#10进制转为2进制p... 查看详情

day06--编码及知识点补充

一,is和==的区别  1,id:通过id我们可以查看到一个变量表示的值在内存中的地址    用id()表示,括号里面放的是想要查看地址的变量    字符串的数据地址是一样的,列表的数据地址是不一样的s="alex"print(id(s))#4434277576s="al... 查看详情

day8_编码和解码

fromurllib.parseimportquote#url编码用的fromurllib.parseimportunquote#url解码用的a=‘圣诞%sfd‘print(quote(a))#会打印出  %E5%9C%A3%E8%AF%9E%25sfd这种编码b=‘%E5%9C%A3%E8%AF%9E%25sfd‘print(unquote(b))#会解码生成原来的&nbs 查看详情

day_06(is==id,编码)

一、id查询内存地址。#name=‘alex‘#print(id(name))#name1=‘alex‘#name2=‘alex‘#print(name1==name2)#=赋值运算==比较数值相同#is内存地址是否相同#小数据池。intstr在一定范围内,如果两个数值相同,为了节省内存,共用一个内存地址。#int-5... 查看详情

深度学习与图神经网络核心技术实践应用高级研修班-day3去噪自编码器(denoising)

去噪自编码器(Denoising)1.问题背景2.问题定义3.实验方案3.1数据来源3.2获取带噪声图片3.3获取带噪声图片3.4模型实现3.5Encoder实现3.6Encoder实现4.实验效果1.问题背景简介自编码器(AutoEncoder)是深度学习中的⼀类无... 查看详情

七css简介及编码规范

一、CSS简介及编码规范1、HTML的局限性说起HTML,这其实是个非常单纯的家伙,它只关注内容的语义。比如<h1>表明这是一个大标题,<p>表明这是一个段落,<img>表明这儿有一个图片,<a>表示此... 查看详情

文本文件与二进制文件及编码关系

文本文件与二进制文件及编码关系(讲了一些基本的概念,但还并不是特别清晰明了,有一些小demo就好了) 查看详情

day3-selenium的使用及

如果是python2的情况下需要设置:#_*_coding:utf-8_*_,这样的编码来保证输入中文在运行时不会报错,另外在中文的前边加上u保证编译时不会报错fromseleniumimportwebdriverdr=webdriver.Chrome()dr.get("http://172.17.3.115:9000/IntelCubeCss/")dr.maximize_window()#... 查看详情

day6字符编码和文件操作

保证不乱吗的核心法则就是,字符按照什么标准而编码的,就要按照什么标准解码,此处的标准指的就是字符编码Unicode转为其他编码是编码,使用的方法是encode()方法,得到的结果是b开头的二进制字符编码,其他编码转为Unicode... 查看详情

自编码器及相关变种算法简介

本文对自编码器(Auto-Encoder)算法及其相关变种算法进行简要介绍,其中包括RegularizedAuto-Encoder、SparseAuto-Encoder、DenoisingAuto-Encoder和ContractiveAuto-Encoder,重点讨论各算法的基本思想及优化时所需目标函数的构造。    ... 查看详情

day03

pyc存放预编译后的字节码文件(半成品都没有)bytes>>>String(解码):encode(encoding="utf-8")String>>>bytes(编码):decode(encoding="utf-8")----------------------------------------------------------------|列表: 加: 查看详情

day03_13多分支if语句及作业

猜年龄升级版age_of_princal=56guess_age=int(input("请输入您猜测的年龄"))ifguess_age==age_of_princal:print("恭喜你,猜对啦!")elifguess_age>age_of_princal:print("猜大啦!")else:print("猜小啦")elif升级版score=int(input("score:"))ifsc 查看详情

day01-文件编码

汉字编码:gb2312(简体汉字)<——兼容——gbk(简体、繁体)<——兼容——gb18030(简体、繁体、少数民族)。ascii->unicode->utf-8python3:所有字符串用Unicode表示,编码后用bytes类型表示:s=‘我爱北... 查看详情