正文

day03_09编码部分历史及文件编码简介

darkalex001  darkalex001  2022-09-18  555

关键词：

详细课件:http://www.cnblogs.com/alex3714/articles/5465198.html

字符编码

支持中文的第一张表就是GB2312

1980 gb2312 6700+

1995 gbk1.0 20000

2000 gb18030 27000

big5 台湾

unicode 万国码支持所有国家和地区的编码

2^16 = 65535 = 存一个字符统一占用2个字节

为了解决字符字节翻倍的问题,出现了UTF-8

UTF-8 = unicode 的扩展及,可变长的字符编码集

ASSIC==>GB2312==>GBK1.0==>GB18030

ASSIC==>UNICODE==>UTF-8

python3.0默认编码是nuicode支持中文

python2.0默认编码默认是ASSIC

如果用python2执行以下代码会报错,因为不支持中文,所以需要加上一行红色代码,终于搞懂为什么不需要在python3中加上这行代码了

#!-*- coding:utf-8 -*-
print "我爱北京天安门!"

windows默认编码是GBK,所以看UTF-8就看不了,所以出现以上错误乱码

解决方法:2种类

#!-*- coding:gbk -*-
print "我爱北京天安门!"

但是如果你使用notepad++的话,默认是utf-8,所以还需要转换一下才行

所以最好不要使用notepad++这个恶心的编辑器...这个编辑器最大的问题就是编码问题,fuck notepad++

因为unicode是向下兼容gb2312的,所以以下代码前加上u,就是可以直接显示中文了

#!-*- coding:utf-8-*-
print  u"我爱北京天安门"

另外一种编码的写法

#coding:utf-8
print  "我爱北京天安门"

把cmd编码还原成GBK格式,在cmd命令行中输入chcp 936

day03-字符编码与转换

1、编码常识在python2中默认编码是 ASCII，而在python3中默认编码是 unicodeunicode 分为utf-32(占4个字节),utf-16(占两个字节)，utf-8(占1-4个字节)，所以utf-16是最常用的unicode版本，但是在文件里存的还是utf-8，因为utf8省空间在pyt... 查看详情

day-3小知识点补充编码集合文件及函数初识

...符 2.单个元素乘以数字不能超过21 2.编码字符：看到内容的最小单位。比如： & 查看详情

day03_用户群组权限及正文处理命令

一.用户、群组和权限用户及passwd文件/etc/passwd文件的功能:存储所有用户的相关信息，该文件也被称为用户信息数据库（Database）/etc/passwd文件每个字段的具体含义a)第1个字段（列）记录的是这个用户的名字（在创建用户时root用户... 查看详情

day47：html(简介及常用标签)

...Language，HTML）通过标签语言来标记要显示的网页中的各个部分。一套规则，浏览器认识的规则。浏览器按顺序渲染网页文件，然后根据标记符解释和显示内容。但需要注意的是，对于不同的浏览器，对同一标签可能会有不完全相... 查看详情

day47：html(简介及常用标签)

day2_数字类型_字符串类型_列表类型_元组_字典_集合_字符编码_文件处理

数字类型：作用：年纪，等级，薪资，身份证号等；10进制转为2进制，利用bin来执行。10进制转为8进制，利用oct来执行。10进制转为16进制，利用hex来执行。#整型age=10print（type(age)）#浮点salary=3000.3print(type(salary))#10进制转为2进制p... 查看详情

day06--编码及知识点补充

一,is和==的区别　　1,id:通过id我们可以查看到一个变量表示的值在内存中的地址　　　　用id()表示,括号里面放的是想要查看地址的变量　　　　字符串的数据地址是一样的,列表的数据地址是不一样的s="alex"print(id(s))#4434277576s="al... 查看详情

day8_编码和解码

fromurllib.parseimportquote#url编码用的fromurllib.parseimportunquote#url解码用的a=‘圣诞%sfd‘print(quote(a))#会打印出 %E5%9C%A3%E8%AF%9E%25sfd这种编码b=‘%E5%9C%A3%E8%AF%9E%25sfd‘print(unquote(b))#会解码生成原来的&nbs 查看详情

day_06(is==id，编码)

一、id查询内存地址。#name=‘alex‘#print(id(name))#name1=‘alex‘#name2=‘alex‘#print(name1==name2)#=赋值运算==比较数值相同#is内存地址是否相同#小数据池。intstr在一定范围内，如果两个数值相同，为了节省内存，共用一个内存地址。#int-5... 查看详情

深度学习与图神经网络核心技术实践应用高级研修班-day3去噪自编码器（denoising）

去噪自编码器（Denoising）1.问题背景2.问题定义3.实验方案3.1数据来源3.2获取带噪声图片3.3获取带噪声图片3.4模型实现3.5Encoder实现3.6Encoder实现4.实验效果1.问题背景简介自编码器（AutoEncoder）是深度学习中的⼀类无... 查看详情

七css简介及编码规范

一、CSS简介及编码规范1、HTML的局限性说起HTML，这其实是个非常单纯的家伙，它只关注内容的语义。比如<h1>表明这是一个大标题，<p>表明这是一个段落，<img>表明这儿有一个图片，<a>表示此... 查看详情

文本文件与二进制文件及编码关系

文本文件与二进制文件及编码关系（讲了一些基本的概念，但还并不是特别清晰明了，有一些小demo就好了）查看详情

day3-selenium的使用及

如果是python2的情况下需要设置:#_*_coding:utf-8_*_,这样的编码来保证输入中文在运行时不会报错，另外在中文的前边加上u保证编译时不会报错fromseleniumimportwebdriverdr=webdriver.Chrome()dr.get("http://172.17.3.115:9000/IntelCubeCss/")dr.maximize_window()#... 查看详情

day6字符编码和文件操作

保证不乱吗的核心法则就是，字符按照什么标准而编码的，就要按照什么标准解码，此处的标准指的就是字符编码Unicode转为其他编码是编码，使用的方法是encode()方法，得到的结果是b开头的二进制字符编码，其他编码转为Unicode... 查看详情

自编码器及相关变种算法简介

本文对自编码器（Auto-Encoder）算法及其相关变种算法进行简要介绍，其中包括RegularizedAuto-Encoder、SparseAuto-Encoder、DenoisingAuto-Encoder和ContractiveAuto-Encoder，重点讨论各算法的基本思想及优化时所需目标函数的构造。 ... 查看详情

day03

pyc存放预编译后的字节码文件（半成品都没有）bytes>>>String(解码):encode(encoding="utf-8")String>>>bytes(编码):decode(encoding="utf-8")----------------------------------------------------------------|列表：加：查看详情

day03_13多分支if语句及作业

猜年龄升级版age_of_princal=56guess_age=int(input("请输入您猜测的年龄"))ifguess_age==age_of_princal:print("恭喜你,猜对啦!")elifguess_age>age_of_princal:print("猜大啦!")else:print("猜小啦")elif升级版score=int(input("score:"))ifsc 查看详情

day01-文件编码

汉字编码：gb2312(简体汉字)<——兼容——gbk（简体、繁体）<——兼容——gb18030（简体、繁体、少数民族）。ascii->unicode->utf-8python3：所有字符串用Unicode表示，编码后用bytes类型表示：s=‘我爱北... 查看详情