从零开始学算法：十种排序算法介绍（上）

2007 年 3 月 31 日2015-01-09 / 30 条评论

    今天我正式开始按照我的目录写我的OI心得了。我要把我所有学到的OI知识传给以后千千万万的OIer。以前写过的一些东西不重复写了，但我最后将会重新整理，使之成为一个完整的教程。
    按照我的目录，讲任何东西之前我都会先介绍时间复杂度的相关知识，以后动不动就会扯到这个东西。这个已经写过了，你可以在这里看到那篇又臭又长的文章。在讲排序算法的过程中，我们将始终围绕时间复杂度的内容进行说明。
    我把这篇文章称之为“从零开始学算法”，因为排序算法是最基础的算法，介绍算法时从各种排序算法入手是最好不过的了。

    给出n个数，怎样将它们从小到大排序？下面一口气讲三种常用的算法，它们是最简单的、最显然的、最容易想到的。选择排序(Selection Sort)是说，每次从数列中找出一个最小的数放到最前面来，再从剩下的n-1个数中选择一个最小的，不断做下去。插入排序(Insertion Sort)是，每次从数列中取一个还没有取出过的数，并按照大小关系插入到已经取出的数中使得已经取出的数仍然有序。冒泡排序(Bubble Sort)分为若干趟进行，每一趟排序从前往后比较每两个相邻的元素的大小（因此一趟排序要比较n-1对位置相邻的数）并在每次发现前面的那个数比紧接它后的数大时交换位置；进行足够多趟直到某一趟跑完后发现这一趟没有进行任何交换操作（最坏情况下要跑n-1趟，这种情况在最小的数位于给定数列的最后面时发生）。事实上，在第一趟冒泡结束后，最后面那个数肯定是最大的了，于是第二次只需要对前面n-1个数排序，这又将把这n-1个数中最小的数放到整个数列的倒数第二个位置。这样下去，冒泡排序第i趟结束后后面i个数都已经到位了，第i+1趟实际上只考虑前n-i个数（需要的比较次数比前面所说的n-1要小）。这相当于用数学归纳法证明了冒泡排序的正确性：实质与选择排序相同。上面的三个算法描述可能有点模糊了，没明白的话网上找资料，代码和动画演示遍地都是。

    这三种算法非常容易理解，因为我们生活当中经常在用。比如，班上的MM搞选美活动，有人叫我给所有MM排个名。我们通常会用选择排序，即先找出自己认为最漂亮的，然后找第二漂亮的，然后找第三漂亮的，不断找剩下的人中最满意的。打扑克牌时我们希望抓完牌后手上的牌是有序的，三个8挨在一起，后面紧接着两个9。这时，我们会使用插入排序，每次拿到一张牌后把它插入到手上的牌中适当的位置。什么时候我们会用冒泡排序呢？比如，体育课上从矮到高排队时，站队完毕后总会有人出来，比较挨着的两个人的身高，指挥到：你们俩调换一下，你们俩换一下。
    这是很有启发性的。这告诉我们，什么时候用什么排序最好。当人们渴望先知道排在前面的是谁时，我们用选择排序；当我们不断拿到新的数并想保持已有的数始终有序时，我们用插入排序；当给出的数列已经比较有序，只需要小幅度的调整一下时，我们用冒泡排序。

    我们来算一下最坏情况下三种算法各需要多少次比较和赋值操作。
    选择排序在第i次选择时赋值和比较都需要n-i次（在n-i+1个数中选一个出来作为当前最小值，其余n-i个数与当前最小值比较并不断更新当前最小值），然后需要一次赋值操作。总共需要n(n-1)/2次比较与n(n-1)/2+n次赋值。
    插入排序在第i次寻找插入位置时需要最多i-1次比较（从后往前找到第一个比待插入的数小的数，最坏情况发生在这个数是所有已经取出的数中最小的一个的时候），在已有数列中给新的数腾出位置需要i-1次赋值操作来实现，还需要两次赋值借助临时变量把新取出的数搬进搬出。也就是说，最坏情况下比较需要n(n-1)/2次，赋值需要n(n-1)/2+2n次。我这么写有点误导人，大家不要以为程序的实现用了两个数组哦，其实一个数组就够了，看看上面的演示就知道了。我只说算法，一般不写如何实现。学算法的都是强人，知道算法了都能写出一个漂亮的代码来。
    冒泡排序第i趟排序需要比较n-i次，n-1趟排序总共n(n-1)/2次。给出的序列逆序排列是最坏的情况，这时每一次比较都要进行交换操作。一次交换操作需要3次赋值实现，因此冒泡排序最坏情况下需要赋值3n(n-1)/2次。
    按照渐进复杂度理论，忽略所有的常数，三种排序的最坏情况下复杂度都是一样的：O(n^2)。但实际应用中三种排序的效率并不相同。实践证明（政治考试时每道大题都要用这四个字），插入排序是最快的（虽然最坏情况下与选择排序相当甚至更糟），因为每一次插入时寻找插入的位置多数情况只需要与已有数的一部分进行比较（你可能知道这还能二分）。你或许会说冒泡排序也可以在半路上完成，还没有跑到第n-1趟就已经有序。但冒泡排序的交换操作更费时，而插入排序中找到了插入的位置后移动操作只需要用赋值就能完成（你可能知道这还能用move）。本文后面将介绍的一种算法就利用插入排序的这些优势。

    我们证明了，三种排序方法在最坏情况下时间复杂度都是O(n^2)。但大家想过吗，这只是最坏情况下的。在很多时候，复杂度没有这么大，因为插入和冒泡在数列已经比较有序的情况下需要的操作远远低于n^2次（最好情况下甚至是线性的）。抛开选择排序不说（因为它的复杂度是“死”的，对于选择排序没有什么“好”的情况），我们下面探讨插入排序和冒泡排序在特定数据和平均情况下的复杂度。
    你会发现，如果把插入排序中的移动赋值操作看作是把当前取出的元素与前面取出的且比它大的数逐一交换，那插入排序和冒泡排序对数据的变动其实都是相邻元素的交换操作。下面我们说明，若只能对数列中相邻的数进行交换操作，如何计算使得n个数变得有序最少需要的交换次数。
    我们定义逆序对的概念。假设我们要把数列从小到大排序，一个逆序对是指的在原数列中，左边的某个数比右边的大。也就是说，如果找到了某个i和j使得i<j且Ai>Aj，我们就说我们找到了一个逆序对。比如说，数列3,1,4,2中有三个逆序对，而一个已经有序的数列逆序对个数为0。我们发现，交换两个相邻的数最多消除一个逆序对，且冒泡排序（或插入排序）中的一次交换恰好能消除一个逆序对。那么显然，原数列中有多少个逆序对冒泡排序（或插入排序）就需要多少次交换操作，这个操作次数不可能再少。
    若给出的n个数中有m个逆序对，插入排序的时间复杂度可以说是O(m+n)的，而冒泡排序不能这么说，因为冒泡排序有很多“无用”的比较（比较后没有交换），这些无用的比较超过了O(m+n)个。从这个意义上说，插入排序仍然更为优秀，因为冒泡排序的复杂度要受到它跑的趟数的制约。一个典型的例子是这样的数列：8, 2, 3, 4, 5, 6, 7, 1。在这样的输入数据下插入排序的优势非常明显，冒泡排序只能哭着喊上天不公。
    然而，我们并不想计算排序算法对于某个特定数据的效率。我们真正关心的是，对于所有可能出现的数据，算法的平均复杂度是多少。不用激动了，平均复杂度并不会低于平方。下面证明，两种算法的平均复杂度仍然是O(n^2)的。
    我们仅仅证明算法需要的交换次数平均为O(n^2)就足够了。前面已经说过，它们需要的交换次数与逆序对的个数相同。我们将证明，n个数的数列中逆序对个数平均O(n^2)个。
    计算的方法是十分巧妙的。如果把给出的数列反过来（从后往前倒过来写），你会发现原来的逆序对现在变成顺序的了，而原来所有的非逆序对现在都成逆序了。正反两个数列的逆序对个数加起来正好就是数列所有数对的个数，它等于n(n-1)/2。于是，平均每个数列有n(n-1)/4个逆序对。忽略常数，逆序对平均个数O(n^2)。
    上面的讨论启示我们，要想搞出一个复杂度低于平方级别的排序算法，我们需要想办法能把离得老远的两个数进行操作。

人们想啊想啊想啊，怎么都想不出怎样才能搞出复杂度低于平方的算法。后来，英雄出现了，Donald Shell发明了一种新的算法，我们将证明它的复杂度最坏情况下也没有O(n^2) （似乎有人不喜欢研究正确性和复杂度的证明，我会用实例告诉大家，这些证明是非常有意思的）。他把这种算法叫做Shell增量排序算法（大家常说的希尔排序）。
Shell排序算法依赖一种称之为“排序增量”的数列，不同的增量将导致不同的效率。假如我们对20个数进行排序，使用的增量为1,3,7。那么，我们首先对这20个数进行“7-排序”(7-sortedness)。所谓7-排序，就是按照位置除以7的余数分组进行排序。具体地说，我们将把在1、8、15三个位置上的数进行排序，将第2、9、16个数进行排序，依此类推。这样，对于任意一个数字k，单看A(k), A(k+7), A(k+14), …这些数是有序的。7-排序后，我们接着又进行一趟3-排序（别忘了我们使用的排序增量为1,3,7）。最后进行1-排序（即普通的排序）后整个Shell算法完成。看看我们的例子：

  3 7 9 0 5 1 6 8 4 2 0 6 1 5 7 3 4 9 8 2  <– 原数列
  3 3 2 0 5 1 5 7 4 4 0 6 1 6 8 7 9 9 8 2  <– 7-排序后
  0 0 1 1 2 2 3 3 4 4 5 6 5 6 8 7 7 9 8 9  <– 3-排序后
  0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9  <– 1-排序后（完成）

    在每一趟、每一组的排序中我们总是使用插入排序。仔细观察上面的例子你会发现是什么导致了Shell排序的高效。对，每一趟排序将使得数列部分有序，从而使得以后的插入排序很快找到插入位置。我们下面将紧紧围绕这一点来证明Shell排序算法的时间复杂度上界。
    只要排序增量的第一个数是1，Shell排序算法就是正确的。但是不同的增量将导致不同的时间复杂度。我们上面例子中的增量(1, 3, 7, 15, 31, …, 2^k-1)是使用最广泛的增量序列之一，可以证明使用这个增量的时间复杂度为O(n√n)。这个证明很简单，大家可以参看一些其它的资料，我们今天不证明它。今天我们证明，使用增量1, 2, 3, 4, 6, 8, 9, 12, 16, …, 2^p*3^q，时间复杂度为O(n*(log n)^2)。
    很显然，任何一个大于1的正整数都可以表示为2x+3y，其中x和y是非负整数。于是，如果一个数列已经是2-排序的且是3-排序的，那么对于此时数列中的每一个数A(i)，它的左边比它大的只有可能是A(i-1)。A2绝对不可能比A12大，因为10可以表示为两个2和两个3的和，则A2<A4<A6<A9<A12。那么，在这个增量中的1-排序时每个数找插入位置只需要比较一次。一共有n个数，所以1-排序是O(n)的。事实上，这个增量中的2-排序也是O(n)，因为在2-排序之前，这个数列已经是4-排序且6-排序过的，只看数列的奇数项或者偶数项（即单看每一组）的话就又成了刚才的样子。这个增量序列巧妙就巧妙在，如果我们要进行h-排序，那么它一定是2h-排序过且3h-排序过，于是处理每个数A(i)的插入时就只需要和A(i-h)进行比较。这个结论对于最开始几次（h值较大时）的h-排序同样成立，当2h、3h大于n时，按照定义，我们也可以认为数列是2h-排序和3h-排序的，这并不影响上述结论的正确性（你也可以认为h太大以致于排序时每一组里的数字不超过3个，属于常数级）。现在，这个增量中的每一趟排序都是O(n)的，我们只需要数一下一共跑了多少趟。也就是说，我们现在只需要知道小于n的数中有多少个数具有2^p*3^q的形式。要想2^p*3^q不超过n，p的取值最多O(log n)个，q的取值最多也是O(log n)个，两两组合的话共有O(logn*logn)种情况。于是，这样的增量排序需要跑O((log n)^2)趟，每一趟的复杂度O(n)，总的复杂度为O(n*(log n)^2)。早就说过了，证明时间复杂度其实很有意思。
    我们自然会想，有没有能使复杂度降到O(nlogn)甚至更低的增量序列。很遗憾，现在没有任何迹象表明存在O(nlogn)的增量排序。但事实上，很多时候Shell排序的实际效率超过了O(nlogn)的排序算法。

后面我们将介绍三种O(nlogn)的排序算法和三种线性时间的排序算法。最后我们将以外部排序和排序网络结束这一章节。

很多人问到我关于转贴的问题。我欢迎除商业目的外任何形式的转贴（论坛、Blog、Wiki、个人网站、PodCast，甚至做成ppt、pdf），但一定要注明出处，最好保留原始链接。我的网站需要点反向链接才能在网络中生存下去，大家也都可以关注并且推广这个Blog。我一直支持cc版权协议，因此发现了文章中的问题或者想要补充什么东西尽管提出来，好让更多的人学习到好东西。我昨天看Blog上原来写的一些东西，居然连着发现了几个错误式子和错别字，好奇大家居然没有提出来。发现了问题真的要告诉我，即使格式有点问题也要说一下，决不能让它那么错着。另外有什么建议或想法也请说一下，我希望听到不同的声音不同的见解，好让我决定这类文章以后的发展方向。

Matrix67原创
转贴请注明出处

分享三道题目的代码+JavaScript Syntax Highlight测试

2007 年 3 月 21 日 / 9 条评论

寒假时没事写了这几个代码，算是我几个月后重操键盘了。这是几道经典题目，可能有人需要，再加上昨天搞JavaScript改过去改过来把PJBlog改得面目全非终于实现了代码高亮忍不住想Show一下，于是把这些代码（连同题目）发了上来。

标准的网络流题目代码

Problem : goods
货物运输

问题描述
    你第一天接手一个大型商业公司就发生了一件倒霉的事情：公司不小心发送了一批次品。很不幸，你发现这件事的时候，这些次品已经进入了送货网。这个送货网很大，而且关系复杂。你知道这批次品要发给哪个零售商，但是要把这批次品送到他手中有许多种途径。送货网由一些仓库和运输卡车组成，每辆卡车都在各自固定的两个仓库之间单向运输货物。在追查这些次品的时候，有必要保证它不被送到零售商手里，所以必须使某些运输卡车停止运输，但是停止每辆卡车都会有一定的经济损失。你的任务是，在保证次品无法送到零售商的前提下，制定出停止卡车运输的方案，使损失最小。

输入格式
    第一行：两个用空格分开的整数N(0<=N<=200)和M(2<=M<=200)。N为运输卡车的数目，M为仓库的数目。1号仓库是公司发货的出口，仓库M属于零售商。
    第二行到第N+1行：每行有三个整数，Si、Ei和Ci。Si和Ei(1<=Si,Ei<=M)分别表示这辆卡车的出发仓库和目的仓库，Ci(0<=Ci<=10,000,000)是让这辆卡车停止运输的损失。

输出格式
    输出一个整数，即最小的损失数。

样例输入
5 4
1 2 40
1 4 20
2 4 20
2 3 30
3 4 10

样例输出
50

样例说明
         40
      1——>2
      |      /|
      |     / |
    20|    /  |30
      |  20   |
      |  /    |
      | /     |
      /_     V
      4<——3
          10

    如图，停止1->4、2->4、3->4三条卡车运输线路可以阻止货物从仓库1运输到仓库4，代价为20+20+10=50。

数据规模
    对于50%的数据，N,M<=25
    对于100%的数据，N,M<=200

program goods;


const
   MaxN=200;
   MaxM=200;
   Infinite=Maxlongint;
type
   rec=record
         node,father:integer;
         minf:longint;
       end;
var
   f,c:array[1..MaxN,1..MaxN]of longint;
   queue:array[1..MaxN]of rec;
   hash:array[1..MaxN]of boolean;
   n,m,closed,open:integer;
procedure readp;
var
   i,x,y:integer;
   t:longint;
begin
   readln(m,n);
   for i:=1 to m do
   begin
      readln(x,y,t);
      c[x,y]:=c[x,y]+t;
   end;
end;
function FindPath:boolean;
   procedure Init;
   begin
      fillchar(hash,sizeof(hash),0);
      fillchar(queue,sizeof(queue),0);
      closed:=0;
      open:=1;
      queue[1].node:=1;
      queue[1].father:=0;
      queue[1].minf:=Infinite;
      hash[1]:=true;
   end;
   function min(a,b:longint):longint;
   begin
      if a<b then min:=a
      else min:=b;
   end;
var
   i,NodeNow:integer;
begin
   Init;
   repeat
      inc(closed);
      NodeNow:=queue[closed].node;
      for i:=1 to n do if not hash[i] then
         if (f[NodeNow,i]<c[NodeNow,i]) then
         begin
            inc(open);
            queue[open].node:=i;
            queue[open].father:=closed;
            queue[open].minf:=min(queue[closed].minf,c[NodeNow,i]-f[NodeNow,i]);
            hash[i]:=true;
            if i=n then exit(true);
         end;
   until closed>=open;
   exit(false);
end;
procedure AddPath;
var
   i,j:integer;
   delta:longint;
begin
   delta:=queue[open].minf;
   i:=open;
   repeat
      j:=queue[i].father;
      inc(f[queue[j].node,queue[i].node],delta);
      dec(f[queue[i].node,queue[j].node],delta);
      i:=j;
   until i=0;
end;
procedure writep;
var
   i:integer;
   ans:longint=0;
begin
   for i:=1 to n do
      ans:=ans+f[1,i];
   writeln(ans);
end;
{====main====}
begin
   assign(input,'goods.in');
   reset(input);
   readp;
   close(input);
   while FindPath do AddPath;

assign(output,'goods.out'); rewrite(output); writep; close(output); end.

统计逆序对 Treap版

Problem : inverse
逆序对

问题描述
    在一个排列中，前面出现的某个数比它后面的某个数大，即当Ai>Aj且i<j时，则我们称Ai和Aj为一个逆序对。给出一个1到N的排列，编程求出逆序对的个数。

输入格式
    第一行输入一个正整数N；
    第二行有N个用空格隔开的正整数，这是一个1到N的排列。

输出格式
    输出输入数据中逆序对的个数。

样例输入
4
3 1 4 2

样例输出
3

样例说明
    在输入数据中，(3,1)、(3,2)和(4,2)是仅有的三个逆序对。

数据规模
    对于30%的数据，N<=1000；
    对于100%的数据，N<=100 000。
program inverse;
const    MaxH=Maxlongint;    type    p=^rec;    rec=record           v,s,h:longint;           left,right:p;        end; var    header:p=nil;    ans:int64=0; procedure CalcuS(var w:p); begin    w^.s:=1;    if w^.right<>nil then inc(w^.s,w^.right^.s);    if w^.left<>nil then inc(w^.s,w^.left^.s); end; function RotateLeft(w:p):p; var    tmp:p; begin    tmp:=w^.left;    w^.left:=tmp^.right;    tmp^.right:=w;    exit(tmp); end; function RotateRight(w:p):p; var    tmp:p; begin    tmp:=w^.right;    w^.right:=tmp^.left;    tmp^.left:=w;    exit(tmp); end; function Insert(a:longint;w:p):p; begin   if w=nil then   begin      new(w);      w^.v:=a;      w^.h:=random(MaxH);      w^.s:=1;      w^.left:=nil;      w^.right:=nil;   end   else if a<w^.v then   begin      ans:=ans+1;      if w^.right<>nil then ans:=ans+w^.right^.s;      w^.left:=Insert(a,w^.left);      if w^.left^.h<w^.h then      begin         w:=RotateLeft(w);         CalcuS(w^.right);      end else         CalcuS(w^.left);   end   else if a>w^.v then   begin      w^.right:=Insert(a,w^.right);      if w^.right^.h<w^.h then      begin         w:=RotateRight(w);         CalcuS(w^.left);      end else         CalcuS(w^.right);   end;   exit(w); end; {====main====} var    n,i,t:longint; begin    randseed:=2910238;       assign(input,'inverse.in');    reset(input);    readln(n);    for i:=1 to n do    begin       read(t);       header:=Insert(t,header);    end;    close(input);
   assign(output,'inverse.out');    rewrite(output);    writeln(ans);    close(output); end.

USACO经典题目：矩形颜色（离散化+扫描）

Problem : rect
矩形颜色

问题描述
　　N个不同颜色的不透明长方形(1<=N<=1000)被放置在一张宽为A长为B的白纸上。这些长方形被放置时，保证了它们的边与白纸的边缘平行。所有的长方形都放置在白纸内，所以我们会看到不同形状的各种颜色。坐标系统的原点(0,0)设在这张白纸的左下角，而坐标轴则平行于边缘。

输入数据
    每行输入的是放置长方形的方法。第一行输入的是那个放在最底下的长方形（即白纸）。
    第一行：A、B和N，由空格分开(1<=A,B<=10,000)
    第二到N+1行：每行为五个整数llx,lly,urx,ury,color。这是一个长方形的左下角坐标，右上角坐标和颜色。颜色1和底部白纸的颜色相同。

输出数据
    输出文件应该包含一个所有能被看到的颜色连同该颜色的总面积的清单（即使颜色的区域不是连续的），按color的增序顺序。
    不要打印出最后不能看到的颜色。

样例输入
20 20 3
2 2 18 18 2
0 8 19 19 3
8 0 10 19 4

样例输出
1 91
2 84
3 187
4 38

数据规模
    对于50%的数据，A,B<=300，N<=60；
    对于100%的数据，A,B<=10000，N<=1000。

program rect;
const    MaxN=1000;       { Rect number in the Worst Case }    MaxCol=1000;     { Color number in the Worst Case }    Infinity=Maxint; { Set to be Heap[0] } type    RecSeg=record             y,x1,x2,order:integer;           end; var    xar,heap:array[0..MaxN*2+2]of integer; { Array of All X-Value and Heap, respectively }    color:array[1..MaxN+1]of integer;      { Index of Color corresponding to order}    ans:array[1..MaxCol]of longint;        { Answers to be print }    seg:array[0..MaxN*2+2]of RecSeg;       { Horizontal Segments }    hash:array[1..MaxN*2+2]of boolean;     { Determine if a Segment has been scanned }    n,HeapSize:integer; procedure SwapInt(var a,b:integer); var    tmp:integer; begin    tmp:=a;    a:=b;    b:=tmp; end; procedure SwapRec(var a,b:RecSeg); var    tmp:RecSeg; begin    tmp:=a;    a:=b;    b:=tmp; end; procedure DataInsert(start,x1,y1,x2,y2,col,order:integer); var    tmp:RecSeg; begin    xar[start]:=x1;    xar[start+1]:=x2;    color[start div 2+1]:=col;    tmp.order:=order;    tmp.y:=y1;    tmp.x1:=x1;    tmp.x2:=x2;    seg[start]:=tmp;    tmp.y:=y2;    seg[start+1]:=tmp; end; procedure Readp; var    a,b,x1,x2,y1,y2,col,i:integer; begin    readln(a,b,n);    n:=n+1;    DataInsert(1,0,0,a,b,1,1);    for i:=2 to n do    begin       readln(x1,y1,x2,y2,col);       DataInsert(2*i-1,x1,y1,x2,y2,col,i);    end; end; procedure SortXar; var    i,j:integer; begin    for i:=1 to 2*n do    for j:=1 to 2*n-1 do       if xar[j]>xar[j+1] then SwapInt(xar[j],xar[j+1]); end; procedure SortSeg; var    i,j:integer; begin    for i:=1 to 2*n do    for j:=1 to 2*n-1 do       if seg[j].y>seg[j+1].y then SwapRec(seg[j],seg[j+1]); end; procedure HeapInsert(x:integer); var    w:integer; begin    inc(HeapSize);    w:=HeapSize;    while Heap[w shr 1]<x do    begin       Heap[w]:=Heap[w shr 1];       w:=w shr 1;    end;    Heap[w]:=x; end; procedure HeapDelete; var &n bsp; x:integer;    w:integer=1; begin    x:=Heap[HeapSize];    dec(HeapSize);    while w shl 1<=HeapSize do    begin       w:=w shl 1;       if (w<>HeapSize) and (Heap[w+1]>Heap[w]) then inc(w);       if Heap[w]>x then Heap[w shr 1]:=Heap[w]       else begin          w:=w shr 1;          break;       end;    end;    Heap[w]:=x; end; procedure Scan(x1,x2:integer); var    i:integer;    j:integer=0; begin    for i:=1 to 2*n do if (seg[i].x1<=x1) and (seg[i].x2>=x2) then    begin       inc(ans[Color[Heap[1]]],(x2-x1)*(seg[i].y-seg[j].y));       hash[seg[i].order]:=not hash[seg[i].order];       if hash[seg[i].order] then HeapInsert(seg[i].order)          else while (HeapSize>0) and not hash[Heap[1]] do HeapDelete;       j:=i;    end; end; procedure Solve; var    i:integer; begin    for i:=1 to 2*n-1 do if xar[i]<xar[i+1] then    begin       fillchar(Heap,Sizeof(Heap),0);       fillchar(hash,Sizeof(hash),0);       HeapSize:=0;       Heap[0]:=Infinity;       Scan(xar[i],xar[i+1]);    end; end; procedure Writep; var    i:integer; begin    for i:=1 to MaxCol do       if ans[i]>0 then writeln(i,' ',ans[i]); end; {====main====} begin    assign(input,'rect.in');    reset(input);    assign(output,'rect.out');    rewrite(output);    Readp;    SortXar;    SortSeg;    Solve;    Writep;
   close(input);    close(output); end.

    这几天大家发现我改PJBlog改错了什么东西导致Bug的话麻烦帮忙报告一下。事实上很有可能有人发现有Bug但是不能报告，因为我很有可能把验证码系统也搞坏了。
    如果这几天大家没有发现问题的话，我把这几天我的PJBlog个性修改方法和心得写出来分享一下（越来越喜欢搞Web Design了）。

做人要厚道
转贴请注明出处
（这篇日志没什么技术含量，感觉写上这两句很别扭）

OIer好帮手：graphviz功能演示

2007 年 3 月 20 日 / 7 条评论

    原来我经常在想，要是有软件能帮我把图论题的数据画出来就好了。后来我想到一个制作这种软件的方法，就是把所有的点的位置设定为圆周上的等分点，这样可以最大限度的保证图象不致于太乱。我没想到居然有程序可以智能地决定哪个点、哪条边放在哪里更好看。
    我在OIBH的这个帖子里找到了这个好东西，它可以帮助OIer将大规模的图论题数据转化为图便于观察。今天我又用到了几次，突然想到把它介绍在我的Blog上。
    graphviz的主页设在http://www.graphviz.org，你可以在这里下载到最新的Windows版本，目前最新版本的安装程序为graphviz-2.12.exe。安装后你可以在dos下（任何目录中）调用它的命令行模式。
    这里，我们使用dot语言。官方网站上有关于dot语言的详细的用户手册，这里我只把常用的一些功能做一下演示。你可以在这篇日志的三个截图中掌握足够的知识来应用graphviz。
    先说明一下最顶上的Hello World程序。dot是程序名，参数-Tgif表示以gif格式输出，参数-O表示输出文件的方式设为默认（在当前目录下输出名为noname的文件，其后缀名与参数-T???所设定的类型相同）。下面一行输入的是graphviz所用的dot语言，digraph G表示有向图，花括号里描述图的内容。这样就生成了一个最简单的图。

下面一个例子说明了如何输出一个边上有权值的无向图。这是OIer经常要用的东西。size=4,4指定了图的大小，单位为英寸。如果没有这一句的话，默认的图要大得多。你可以另外写一个程序把你的数据按图中的格式转化为dot代码。虽然graphviz可以从外部文件中读入这段代码，但我觉得粘贴进dos窗口更方便一些。

下面这个例子包含更多的参数，展示了graphviz更多的功能。输出为ps文件更好看一些，因为输出ps文件可以反锯齿（应该是矢量的）。

令人称奇的简单证明：五种方法证明根号2是无理数

2007 年 3 月 14 日 / 39 条评论

我喜欢各种各样的证明。有史以来我见过的最诡异的证明写在http://www.matrix67.com/blog/article.asp?id=34。人们很难想到这样一些完全找不到突破口的东西竟然能够证明得到。说“没有突破口”还不够确切。准确地说，有些命题多数人认为“怎么可能能够证明”却用了一些技巧使得证明变得非常简单。我看了五色定理的证明，定理宣称若要对地图进行染色使得相邻区域不同色，五种颜色就够了。没看证明之前，我一直在想这个玩意儿可以怎么来证明。直到看了证明过程后才感叹居然如此简单，并且立即意识到四色定理基本上也是这种证明方法。还有，像“一个单位正方形里不可能包含两个互不重叠且边长和超过1的小正方形”这样的命题竟然完全用初中学的那些平面几何知识证明到了，简单得不可思议。关键是，我们能够读懂证明过程，但只有牛人才能想到这个证明过程。
今天在OIBH上看到了这个帖子，帖子中哲牛分享的一篇文章The Power Of Mathematics恰好说明了这一点。文章中包含有一个推翻“万物皆数”的新思路，相当有启发性。今天我想把我已经知道的四种证明连同新学到的这一个一起写下来。

    如何证明存在一种不能表示为两个整数之比的数？
    古希腊曾有“万物皆数”的思想，这种认为“大自然的一切皆为整数之比”的思想统治了古希腊数学相当长的一段时间，许多几何命题都是根据这一点来证明的。当时的很多数学证明都隐性地承认了“所有数都可以表示为整数之比”，“万物皆数”的思想是古希腊数学发展的奠基。直到有一天，毕达哥拉斯的学生Hippasus告诉他，单位正方形的对角线长度不能表示为两个整数之比。被人们公认的假设被推翻了，大半命题得证的前提被认定是错的，古希腊时代的数学大厦轰然倒塌，数学陷入了历史上的第一次危机。最后，Eudoxus的出现奇迹般地解决了这次危机。今天我们要看的是，为什么单位正方形的对角线长度不能表示为两个整数之比。

    单位正方形的对角线长度怎么算呢？从上面的这个图中我们可以看到，如果小正方形的面积是1的话，大正方形的面积就是2。于是单位正方形的对角线是面积为2的正方形的边长。换句话说，Hippasus认为不可能存在某个整数与整数之比，它的平方等于2。
    中学课程中安排了一段反证法。当时有个题目叫我们证根号2是无理数，当时很多人打死了也想不明白这个怎么可能证得到，这种感觉正如前文所说。直到看了答案后才恍然大悟，数学上竟然有这等诡异的证明。
    当然，我们要证明的不是“根号2是无理数”。那个时候还没有根号、无理数之类的说法。我们只能说，我们要证明不存在一个数p/q使得它的平方等于2。证明过程地球人都知道：假设p/q已经不能再约分了，那么p^2=2*q^2，等式右边是偶数，于是p必须是偶数。p是偶数的话，p^2就可以被4整除，约掉等式右边的一个2，可以看出q^2也是偶数，即q是偶数。这样，p也是偶数，q也是偶数，那么p和q就还可以继续约分，与我们的假设矛盾。

根号2是无理数，我们证明到了。根号3呢？根号5呢？你可能偶尔看到过，Theodorus曾证明它们也是无理数。但Theodorus企图证明17的平方根是无理数时却没有继续证下去了。你可以在网上看到，Theodorus对数学的贡献之一就是“证明了3到17的非平方数的根是无理数”。这给后人留下了一个疑问：怪了，为什么证到17就不证了呢？一个俄国的数学历史家“猜”到了原因。
他猜测，当时Theodorus就是用类似上面的方法证明的。比如，要证明根号x不是有理数，于是p^2=x*q^2。我们已经证过x=2的情况了，剩下来的质数都是奇数。如果x是奇数且p/q已经不能再约分，那么显然p和q都是奇数。一个奇数2n+1的平方应该等于4(n^2+n)+1，也即8 * n(n+1)/2 + 1，其中n(n+1)/2肯定是一个整数。如果p=2k+1，q=2m+1，把它们代进p^2=x*q^2，有8[k(k+1)/2 – x*m(m+1)/2] = x-1。于是x-1必须是8的倍数。如果当时Theodorus是这么证明的，那么他可以得到这样一个结论，如果x-1不能被8整除，那么它不可能被表示成(p/q)^2。好了，现在3、5、7、11、13减去1后都不是8的倍数，它们的平方根一定不是有理数。在x=9时发生了一次例外，但9是一个平方数。而当x=17时这种证明方法没办法解释了，于是Theodorus就此打住。

    实际上，我们上面说的这么多，在古希腊当时的数学体系中是根本不可能出现的。毕达哥拉斯时代根本没有发展出代数这门学科来，它们掌握的只是纯粹的几何。因此，Hippasus当时的证明不可能像我们现在这样搞点什么奇数x偶数y之类的高科技东西。事实上，Hippasus当时完全运用的平面几何知识来证明他的结论。有人觉得奇怪了，既然当时没有代数，古希腊人是怎么提出“所有数都可以表示为整数之比”的呢？其实古希腊人根本没有提出什么整数之比，这是后人的一个误解。当时毕达哥拉斯学派提出的，叫做“公度单位”。
    两条线段的公度单位，简单的说就是找一个公度量，使得两条线段的长度都是这个公度量的整倍数（于是这个公度量就可以同时作为两条线段的单位长度并用于测量）。寻找公度量的方法相当直观，就是不断把较长的那个线段减去短的那个线段，直到两个线段一样长。熟悉数论的同学一下就明白了这就是欧几里德的辗转相除算法求最大公约数。第一次数学危机的根结就在于，古希腊人理所当然地相信不断地截取线段，总有一个时候会截到两个线段一样长。后来，Hippasus画了这么一张图，告诉大家了一个反例：有可能这个操作会无穷尽地进行下去。

    现在看他怎么解释，在图中的BC和BD之间进行辗转相除为什么永远不能停止。把BD减去BC，剩下一段DE。以DE为边做一个新的小正方形DEFG，那么显然DE=EF=FC（∵△EDF为等腰直角且△BEF≌△BCF）。接下来我们应该在BC和DE间辗转相除。BC就等于CD，CD减去一个DE相当于减去一个FC，就只剩下一段DF了。现在轮到DE和DF之间辗转相除，而它们是一个新的正方形的边和对角线，其比例正好与最初的BC和BD相当。于是，这个操作再次回到原问题，并且无限递归下去。最后的结论用我们的话说就是，不存在一个数x使得BC和BD的长度都是x的整倍数。于是，BD/BC不能表示为两个整数之比p/q（否则BD/p=BC/q，这就成为了那个x）。

有发现上面的代数证明和几何证明之间的共同点吗？它们都是这样的一个思路：假设我已经是满足这个性质的最小的那个了，那么我就可以用一种方法找出更小的一个来，让你无限循环下去，数目越来越小，永

非传统题型练习：解析一道循环赛题目

2007 年 3 月 11 日 / 5 条评论

Problem: game 取数游戏
题目来源：Matrix67根据经典问题改编

问题描述
    选数游戏是一个两人游戏。两人将轮流从1到9这九个数字中取数，取过的数不能再取。我们规定，谁取到的数里能找到三个数，使得这三个数的和为15，谁就获得了这次游戏的胜利。如果A取了1、6、7三个数，B取了2、3、5，若这时该A继续取数，则A取8可以获得胜利，因为当A获得了数字8后，出现了1+6+8=15。
    在游戏的每一着中，你可以得到此时游戏的状态。请你编程选择一种赢得游戏的最佳策略。

输入格式
    第一行输入若干个用空格隔开的数，表示你已经取了的数。这些数递增排列。
    第二行输入若干个用空格隔开的数，表示对手已经取了的数。这些数递增排列。
    当某一行没有数字（某个游戏者还没有选数）时，该行仍然会留出位置。

输出格式
    输出你认为此时你的最佳选择。

样例输入
1 6 7
2 3 5

样例代码
    下面的代码演示了游戏的这样一个策略：每一次总是选择最大的没有被取过的数。

program game;
var
   hash:array[1..9]of boolean;
   i:integer;
begin
   assign(input,'game.in');
   reset(input);
   repeat
      read(i);
      hash[i]:=true;
   until eof;
   close(input);

   for i:=9 downto 1 do
      if not hash[i] then break;
   assign(output,'game.out');
   rewrite(output);
   writeln(i);
   close(output);
end.

评分方法
    该题目将通过选手之间的循环赛进行评分。
    在某两个选手对抗时，测试程序将导入这两个选手的源程序并进行编译，然后轮流为选手编写输入文件实时描述对战情况。选手的输出文件将作为此次选手的决策提交上来。当游戏已经出现获胜方或无法继续进行时，测试程序自动结束。每两个选手比赛时将分两场进行，一场对抗后先行者将进行交换。任一次对抗中，选手胜一场得2分，负一场得-2分，平一场得0分（这个分数不是选手该题的最后得分）。对比赛得分进行排名后，若总选手数为n，你的排名为i，那么你的得分为(n-i+1)*100/n。得分为小数则取下整。排名相同则平分该段得分。
    选手程序出现以下情况将作为该次对抗的负者处理：
        选手程序单着运行时间超过1秒；
        选手内存占用超过64M；
        选手程序未输出决策或输出错误；
        选手程序非正常退出；
        选手程序发生错误导致评测程序非法退出。

大家有没有看出来，这个游戏就是一个井字棋游戏。3个数加起来等于15一共有8种情况，而这8种情况恰好对应一个3阶幻方中的三个横行、三个纵列和两个对角线。也就是说，如果把这个游戏想成在下面的棋盘中进行，那就和井字棋游戏没什么两样了。

   +—+—+—+
   | 8 | 1 | 6 |
   +—+—+—+
   | 3 | 5 | 7 |
   +—+—+—+
   | 4 | 9 | 2 |
   +—+—+—+

关于井字棋游戏，之前我曾有过研究。
原来学博弈论之类的东西时，我曾写过一个程序，计算井字棋游戏的最佳策略。但不管我怎么搞，这个程序总是先走最角落的位置，这是十分可笑的。我一直在想，我的程序哪点儿有问题。后来我想到了。我的程序没有任何问题，而是人的习惯性思考出的错。我的程序计算出来的结果是对的，在井字棋游戏中开局占领一个角的胜算最大。

比如说，现在我占了最左下角的那一个位置。那么下一步如果你走的是画了“X”的位置，你就输了。

   +—+—+—+
   | X | X | X |
   +—+—+—+
   | X |   | X |
   +—+—+—+
   | O | X | X |
   +—+—+—+

    下面的图1到图4这四个棋谱，它包含了除第二步走中间以外所有的分支情况。可以看出，如果你第二步不占领中间的话，你是必败的。
    图5告诉我们，即使对手占住了中间，第四步棋也有2/6个陷阱可以置他于死地。而另外4/6将导致棋局最终打平。假设每一步对方都是随机走的话，打到图6的情况概率为(1/8) * (4/6)，约为8.33%。反过来，我的胜算超过了90%。这在理论上可能是最大的了。
    当然，对手没有那么傻。面对这种情况，理智的人第二步总会想要占领中间的格子。考虑到这一点的话，胜算或许不到50%。

仔细思考，你会发现，如果你第一步占领了中间的话，胜算是可以达到50%的。图7表明了这样一种情况，如果你第一步走中间，而对手不小心走到了边上，那么他就完了。比起前面的那些来，这里的陷阱可能更隐蔽一些。
剩下的三个图表明，对手走了4个角中的一个后，最终结果必然是平局。

至于以上这么多棋谱到底该选用哪一个，这个决策是属于自己的。

我们考虑自己先行的所有情况的同时，也看清了自己作为后行者可能遇到的陷阱。对照以上棋谱，我们可以轻易获得平局的结果。

由于井字棋游戏的总的情况数也只有那么多，变数不大，因此这个东西是一个非常入门级的东西。实际写程序的时候，分类讨论的效果比博弈树更好。

Matrix67原创
转贴请注明出处

