飞污熊小站

个人知识星球，专注于Python/Java/AI技术

Python核心 - 打包与发布

XiongNeng 发布于 2015-10-26 收录于 Python

当需要将写的程序打包分发出去的时候，就要使用到setuptools工具了，这里我通过一个实际例子来介绍它的使用方法。之前写过一个rpc模块叫xnrpc：

github项目地址：https://github.com/yidao620c/xnrpc
pipi模块地址：https://pypi.python.org/pypi/xnrpc

软件包归档格式

Python的软件包一开始是没有官方的标准分发格式的。比如Java有jar包或者war包作为分发格式，Python则什么都没有。后来不同的工具都开始引入一些比较通用的归档格式。比如，setuptools引入了Egg格式。但是，这些都不是官方支持的，存在元数据和包结构彼此不兼容的问题。因此，为了解决这个问题， PEP 427定义了新的分发包标准，名为Wheel。目前pip和setuptools工具都支持Wheel格式。这里我们简单总结一下常用的分发格式：

Python核心 - 字符串编码

XiongNeng 发布于 2015-10-24 收录于 Python

字符串也是一种数据类型，但是，字符串比较特殊的是还有一个编码问题。

Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。Unicode标准也在不断发展，但最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。

Python核心 - 函数式编程

XiongNeng 发布于 2015-10-22 收录于 Python

函数式编程就是一种抽象程度很高的编程范式，纯粹的函数式编程语言编写的函数没有变量(或者说不能给变量重新赋值)，因此，任意一个函数，只要输入是确定的，输出就是确定的，这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言，由于函数内部的变量状态不确定，同样的输入，可能得到不同的输出，因此，这种函数是有副作用的。

归并排序中对小数组采用插入排序

XiongNeng 发布于 2015-09-22 收录于算法之美

纯归并排序的复杂度为O(nlgn)，而纯插入排序的时间复杂度为O(n^2)。数据量很大的时候采用归并排序。

但是在n较小的时候插入排序可能运行的会更快点。因此在归并排序中当子问题变得足够小时，采用插入排序来使得递归的叶子变粗可以加快排序速度。那么这个足够小到底怎么去衡量呢？请看下面：

CentOS6.5上LVS和KeepAlived搭建高可用负载均衡集群

XiongNeng 发布于 2015-09-16 收录于 Linux

我们不仅要知其然，而且要知其所以然，所以先给大家准备一些理论知识课，这样对以后的应用将会事半功倍。

1、什么是LVS？

请阅读作者章文嵩博士自己的研究报告，共计4部分，看完后对集群和LVS就有了初步的了解，不懂时可以翻翻。

NIO笔记-缓存器细节

XiongNeng 发布于 2015-06-20 收录于 Java

Buffer由数据和可以高效访问以及操纵这些数据的四个索引组成，这四个索引是：mark、position、limit、capacity。下表是用于设置和复位索引以及查询它们的方法：

方法	说明
capacity()	返回缓存区容量
clear()	清空缓存区，position=0，limit=capacity，此方法可覆写缓存区
flip()	limit=position，position=0，用于准备从缓存区读取已经写入的数据
limit()	返回limit的值
limit(int lim)	设置limit的值
mark()	将mark设置为position
position()	返回position的值
position(int pos)	设置position的值
remaining()	返回(limit - position)
hasRemaining()	若有介于position和limit之间的元素，返回true
reset()	将position设置为mark
rewind()	将position设置为0，也就是缓存区的开始位置

在缓存区中插入和提取数据的方法会更新这些索引，用于反映所发生的变化。