<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ChuckZ : Blog &#187; OpenGL</title>
	<atom:link href="http://blog.chuckzhang.net/tags/opengl/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.chuckzhang.net</link>
	<description>Life of Game Development</description>
	<lastBuildDate>Sat, 04 Feb 2012 04:43:00 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.1</generator>
		<item>
		<title>深入探索正交投影变换</title>
		<link>http://blog.chuckzhang.net/2009/09/insideortholh/</link>
		<comments>http://blog.chuckzhang.net/2009/09/insideortholh/#comments</comments>
		<pubDate>Sun, 13 Sep 2009 09:42:49 +0000</pubDate>
		<dc:creator>chuck</dc:creator>
				<category><![CDATA[Game Develop]]></category>
		<category><![CDATA[Direct3D]]></category>
		<category><![CDATA[Game]]></category>
		<category><![CDATA[OpenGL]]></category>
		<category><![CDATA[Tech]]></category>
		<category><![CDATA[正交投影]]></category>

		<guid isPermaLink="false">http://blog.chuckzhang.net/?p=328</guid>
		<description><![CDATA[在具体研究之前我觉得有必要把平面投影的分类简单介绍一下，目的是为了让大家有一个总体的认识，从而更好的理解这个知识体系。请看下图： 平面投影分为平行投影和透视投影两种类型，后者我们在前两篇文章中介绍了。平行投影则是具有矩形观察体的投影方式（透视投影则是视锥观察体），它不会根据物体离视点的远近缩放物体（透视投影则会）。平行投影可以分成侧投影和正交投影两种类型。这两种类型如何区分呢？ 我们继续看图吧： 上图中，v是投影平面，n是它的法线。p和q是平面外两点，p’和q’分别是它们在平面上的投影点。q的投影方向向量为Q = 单位化（q’-q），而p的投影方向向量为P = 单位化（p’-p），其中Q不平行于n而P平行于n，则q的投影叫做侧投影，而p的投影叫做正交投影。正交投影是我们今天的研究对象。 实际上上面对平面投影的分类还可以继续向下细分，比如透视投影可以分为一灭点、二灭点以及三灭点透视投影。侧投影则可以继续分为散点侧投、斜二轴侧投等等。而正交投影则可以分成轴侧投影以及多视点正交投影等等。如果读者对此感兴趣，可以参考相关的图形学教程。 接下来我们研究正交投影。分别介绍OpenGL、D3D。我们的环境约定（左右手坐标系、行列向量乘法、CVV范围）仍然尊重相应API自己的设置。 OpenGL正交投影变换 下图是OpenGL的右手坐标系中观察空间的情形，我们看到的是正交投影的矩形观察体，原点是相机位置，n是近裁剪平面到相机平面的距离，f是远裁剪平面到相机平面的距离。p是观察体中的一个点，p’是它投影之后的点。 投影之后我们有关系： 因为是正交投影，没有统一的投影射线目标点，因此投影之后的x和y不会变，而z则永远地变成了-n，跑到了投影平面上（我们让投影平面和近裁剪平面重合），它已经没用了，则我们用这个没用的信息保存z（为了之后片元操作的时候用），写为： 从而在z方向上构建 CVV，使得当z在近裁剪平面的时候，az+b=-1，而z在远裁剪平面的时候az+b=1（OpenGL的CVV的z范围是[-1,1]，我已经说了三遍了，如果读者感到迷惑不解，强烈建议把前两篇文章理解）。我们算出a和b 然后我们就通过当前的结果反推正交投影矩阵版本一 接着把x和y建立成CVV情形（简单的线性插值） 反推正交投影矩阵版本二（最终版本） 则右边的那个矩阵就是OpenGL的正交投影矩阵，它可以通过glOrtho创建出来。OpenGL的解决了，下面是D3D的。 D3D正交投影变换 下图是D3D左手坐标系中观察空间的情形。因为是左手坐标系，因此近裁剪平面在z = n平面，而远裁剪平面在z = f平面。 投影之后，有 用第三个没用的信息保存z，写为 使得（D3D的CVV的z范围是[0, 1]） 反推正交投影矩阵版本一 对x和y进行CVV线性插值 分两种情况讨论（如果读者对此不清楚，请参考《深入探索透视投影变换》）： （1）       投影平面居中，销掉两边的1/2，然后反推正交投影矩阵 后面那个矩阵就是相应正交投影矩阵，这个也是D3DXMatrixOrthoLH方法所使用的情况。 （2）       一般情况，投影平面不一定居中，直接通过投影结果反推正交投影矩阵 后面那个矩阵就是相应的正交投影矩阵，这个也是D3DXMatrixOrthoOffCenterLH方法所使用的情况。 标签：Direct3D, Game, OpenGL, Tech, 正交投影]]></description>
			<content:encoded><![CDATA[<p>在具体研究之前我觉得有必要把平面投影的分类简单介绍一下，目的是为了让大家有一个总体的认识，从而更好的理解这个知识体系。请看下图：</p>
<p><img class="alignnone size-medium wp-image-329" title="1" src="http://blog.chuckzhang.net/uploads/2009/09/1-300x153.jpg" alt="1" width="317" height="161" /></p>
<p>平面投影分为平行投影和透视投影两种类型，后者我们在前两篇文章中介绍了。平行投影则是具有矩形观察体的投影方式（透视投影则是视锥观察体），它不会根据物体离视点的远近缩放物体（透视投影则会）。平行投影可以分成侧投影和正交投影两种类型。这两种类型如何区分呢？</p>
<p><span id="more-328"></span></p>
<p>我们继续看图吧：</p>
<p><img class="alignnone size-full wp-image-330" title="2" src="http://blog.chuckzhang.net/uploads/2009/09/2.jpg" alt="2" width="180" height="166" /></p>
<p>上图中，v是投影平面，n是它的法线。p和q是平面外两点，p’和q’分别是它们在平面上的投影点。q的投影方向向量为Q = 单位化（q’-q），而p的投影方向向量为P = 单位化（p’-p），其中Q不平行于n而P平行于n，则q的投影叫做侧投影，而p的投影叫做正交投影。正交投影是我们今天的研究对象。</p>
<p>实际上上面对平面投影的分类还可以继续向下细分，比如透视投影可以分为一灭点、二灭点以及三灭点透视投影。侧投影则可以继续分为散点侧投、斜二轴侧投等等。而正交投影则可以分成轴侧投影以及多视点正交投影等等。如果读者对此感兴趣，可以参考相关的图形学教程。</p>
<p>接下来我们研究正交投影。分别介绍OpenGL、D3D。我们的环境约定（左右手坐标系、行列向量乘法、CVV范围）仍然尊重相应API自己的设置。</p>
<p><span style="font-size: medium;"><strong>OpenGL正交投影变换</strong></span></p>
<p>下图是OpenGL的右手坐标系中观察空间的情形，我们看到的是正交投影的矩形观察体，原点是相机位置，n是近裁剪平面到相机平面的距离，f是远裁剪平面到相机平面的距离。p是观察体中的一个点，p’是它投影之后的点。</p>
<p><img class="alignnone size-medium wp-image-331" title="3" src="http://blog.chuckzhang.net/uploads/2009/09/3-300x204.jpg" alt="3" width="300" height="204" /></p>
<p>投影之后我们有关系：</p>
<p><img class="alignnone size-full wp-image-332" title="4" src="http://blog.chuckzhang.net/uploads/2009/09/4.jpg" alt="4" width="144" height="96" /></p>
<p>因为是正交投影，没有统一的投影射线目标点，因此投影之后的x和y不会变，而z则永远地变成了-n，跑到了投影平面上（我们让投影平面和近裁剪平面重合），它已经没用了，则我们用这个没用的信息保存z（为了之后片元操作的时候用），写为：</p>
<p><img class="alignnone size-full wp-image-333" title="5" src="http://blog.chuckzhang.net/uploads/2009/09/5.jpg" alt="5" width="85" height="96" /></p>
<p>从而在z方向上构建 CVV，使得当z在近裁剪平面的时候，az+b=-1，而z在远裁剪平面的时候az+b=1（OpenGL的CVV的z范围是[-1,1]，我已经说了三遍了，如果读者感到迷惑不解，强烈建议把前两篇文章理解）。我们算出a和b</p>
<p><img class="alignnone size-full wp-image-334" title="6" src="http://blog.chuckzhang.net/uploads/2009/09/6.jpg" alt="6" width="225" height="88" /></p>
<p>然后我们就通过当前的结果反推正交投影矩阵版本一</p>
<p><img class="alignnone size-full wp-image-336" title="8" src="http://blog.chuckzhang.net/uploads/2009/09/8.jpg" alt="8" width="277" height="104" /></p>
<p>接着把x和y建立成CVV情形（简单的线性插值）</p>
<p><img class="alignnone size-medium wp-image-335" title="7" src="http://blog.chuckzhang.net/uploads/2009/09/7-300x72.jpg" alt="7" width="300" height="72" /></p>
<p>反推正交投影矩阵版本二（最终版本）</p>
<p><img class="alignnone size-medium wp-image-337" title="9" src="http://blog.chuckzhang.net/uploads/2009/09/9-300x125.jpg" alt="9" width="300" height="125" /></p>
<p>则右边的那个矩阵就是OpenGL的正交投影矩阵，它可以通过glOrtho创建出来。OpenGL的解决了，下面是D3D的。</p>
<p><span style="font-size: medium;"><strong>D3D正交投影变换</strong></span></p>
<p>下图是D3D左手坐标系中观察空间的情形。因为是左手坐标系，因此近裁剪平面在z = n平面，而远裁剪平面在z = f平面。</p>
<p><img class="alignnone size-medium wp-image-338" title="10" src="http://blog.chuckzhang.net/uploads/2009/09/10-300x204.jpg" alt="10" width="300" height="204" /></p>
<p>投影之后，有</p>
<p><img class="alignnone size-full wp-image-339" title="11" src="http://blog.chuckzhang.net/uploads/2009/09/11.jpg" alt="11" width="149" height="100" /></p>
<p>用第三个没用的信息保存z，写为</p>
<p><img class="alignnone size-full wp-image-340" title="12" src="http://blog.chuckzhang.net/uploads/2009/09/12.jpg" alt="12" width="93" height="100" /></p>
<p>使得（D3D的CVV的z范围是[0, 1]）</p>
<p><img class="alignnone size-full wp-image-341" title="13" src="http://blog.chuckzhang.net/uploads/2009/09/13.jpg" alt="13" width="219" height="88" /></p>
<p>反推正交投影矩阵版本一</p>
<p><img class="alignnone size-full wp-image-342" title="14" src="http://blog.chuckzhang.net/uploads/2009/09/14.jpg" alt="14" width="279" height="128" /></p>
<p>对x和y进行CVV线性插值</p>
<p><img class="alignnone size-full wp-image-343" title="15" src="http://blog.chuckzhang.net/uploads/2009/09/15.jpg" alt="15" width="280" height="88" /></p>
<p>分两种情况讨论（如果读者对此不清楚，请参考《深入探索透视投影变换》）：</p>
<p>（1）       投影平面居中，销掉两边的1/2，然后反推正交投影矩阵</p>
<p><img class="alignnone size-medium wp-image-344" title="16" src="http://blog.chuckzhang.net/uploads/2009/09/16-300x192.jpg" alt="16" width="300" height="192" /></p>
<p>后面那个矩阵就是相应正交投影矩阵，这个也是D3DXMatrixOrthoLH方法所使用的情况。</p>
<p>（2）       一般情况，投影平面不一定居中，直接通过投影结果反推正交投影矩阵</p>
<p><img class="alignnone size-medium wp-image-345" title="17" src="http://blog.chuckzhang.net/uploads/2009/09/17-300x200.jpg" alt="17" width="300" height="200" /></p>
<p><span style="font-size: small;"><span style="font-family: 宋体;">后面那个矩阵就是相应的正交投影矩阵，这个也是</span><span lang="EN-US"><span style="font-family: Times New Roman;">D3DXMatrixOrthoOffCenterLH</span></span><span style="font-family: 宋体;">方法所使用的情况。</span></span></p>

	标签：<a href="http://blog.chuckzhang.net/tags/direct3d/" title="Direct3D" rel="tag">Direct3D</a>, <a href="http://blog.chuckzhang.net/tags/game/" title="Game" rel="tag">Game</a>, <a href="http://blog.chuckzhang.net/tags/opengl/" title="OpenGL" rel="tag">OpenGL</a>, <a href="http://blog.chuckzhang.net/tags/tech/" title="Tech" rel="tag">Tech</a>, <a href="http://blog.chuckzhang.net/tags/%e6%ad%a3%e4%ba%a4%e6%8a%95%e5%bd%b1/" title="正交投影" rel="tag">正交投影</a><br />
]]></content:encoded>
			<wfw:commentRss>http://blog.chuckzhang.net/2009/09/insideortholh/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>深入探索透视投影变换</title>
		<link>http://blog.chuckzhang.net/2009/09/insideperspectivelh/</link>
		<comments>http://blog.chuckzhang.net/2009/09/insideperspectivelh/#comments</comments>
		<pubDate>Sun, 13 Sep 2009 09:23:47 +0000</pubDate>
		<dc:creator>chuck</dc:creator>
				<category><![CDATA[Game Develop]]></category>
		<category><![CDATA[Direct3D]]></category>
		<category><![CDATA[Game]]></category>
		<category><![CDATA[OpenGL]]></category>
		<category><![CDATA[Tech]]></category>
		<category><![CDATA[透视投影]]></category>

		<guid isPermaLink="false">http://blog.chuckzhang.net/?p=269</guid>
		<description><![CDATA[透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。在算法中它是通过透视矩阵乘法和透视除法两步完成的。 透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。 没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…)就可以根据输入生成一个透视投影矩阵。而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。但是你不觉得，如果想要成为一个职业的图形程序员或游戏开发者，就应该真正降伏透视投影这个家伙么？我们先从必需的基础知识着手，一步一步深入下去（这些知识在很多地方可以单独找到，但我从来没有在同一个地方全部找到，但是你现在找到了J）。 我们首先介绍两个必须掌握的知识。有了它们，我们才不至于在理解透视投影变换的过程中迷失方向。 齐次坐标表示 透视投影变换是在齐次坐标下进行的，而齐次坐标本身就是一个令人迷惑的概念，这里我们先把它理解清楚。 对于一个向量v以及基oabc， 可以找到一组坐标(v1,v2,v3)，使得 v = v1 a + v2 b + v3 c （1） 而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得 p – o = p1 a + p2 b + p3 c （2） 从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p – o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p: p = o + p1 a + p2 b + p3 c (3) (1)(3)是坐标系下表达一个向量和点的不同表达方式。这里可以看出，虽然都是用代数分量的形式表达向量和点，但表达一个点比一个向量需要额外的信息。如果我写出一个代数分量表达(1, 4, 7)，谁知道它是个向量还是个点！ [...]]]></description>
			<content:encoded><![CDATA[<p>透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。在算法中它是通过透视矩阵乘法和透视除法两步完成的。</p>
<p>透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。</p>
<p>没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…)就可以根据输入生成一个透视投影矩阵。而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。但是你不觉得，如果想要成为一个职业的图形程序员或游戏开发者，就应该真正降伏透视投影这个家伙么？我们先从必需的基础知识着手，一步一步深入下去（这些知识在很多地方可以单独找到，但我从来没有在同一个地方全部找到，但是你现在找到了J）。</p>
<p><span id="more-269"></span></p>
<p>我们首先介绍两个必须掌握的知识。有了它们，我们才不至于在理解透视投影变换的过程中迷失方向。<br />
齐次坐标表示<br />
透视投影变换是在齐次坐标下进行的，而齐次坐标本身就是一个令人迷惑的概念，这里我们先把它理解清楚。<br />
对于一个向量v以及基oabc，</p>
<p><img class="alignnone size-full wp-image-270" title="1" src="http://blog.chuckzhang.net/uploads/2009/09/1.GIF" alt="1" width="149" height="159" /></p>
<p>可以找到一组坐标(v1,v2,v3)，使得<br />
v = v1 a + v2 b + v3 c （1）<br />
而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得<br />
p – o = p1 a + p2 b + p3 c （2）</p>
<p>从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p – o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:<br />
p = o + p1 a + p2 b + p3 c (3)</p>
<p>(1)(3)是坐标系下表达一个向量和点的不同表达方式。这里可以看出，虽然都是用代数分量的形式表达向量和点，但表达一个点比一个向量需要额外的信息。如果我写出一个代数分量表达(1, 4, 7)，谁知道它是个向量还是个点！</p>
<p>我们现在把（1）（3）写成矩阵的形式：</p>
<p><img class="alignnone size-full wp-image-271" title="2" src="http://blog.chuckzhang.net/uploads/2009/09/2.GIF" alt="2" width="208" height="184" /></p>
<p>这里(a,b,c,o)是坐标基矩阵，右边的列向量分别是向量v和点p在基下的坐标。这样，向量和点在同一个基下就有了不同的表达：3D向量的第4个代数分量是0，而3D点的第4个代数分量是1。像这种这种用4个代数分量表示3D几何概念的方式是一种齐次坐标表示。<br />
“齐次坐标表示是计算机图形学的重要手段之一，它既能够用来明确区分向量和点，同时也更易用于进行仿射（线性）几何变换。”—— F.S. Hill, JR<br />
这样，上面的(1, 4, 7)如果写成（1,4,7,0），它就是个向量；如果是(1,4,7,1)，它就是个点。<br />
下面是如何在普通坐标(Ordinary Coordinate)和齐次坐标(Homogeneous Coordinate)之间进行转换：<br />
从普通坐标转换成齐次坐标时，<br />
如果(x,y,z)是个点，则变为(x,y,z,1);<br />
如果(x,y,z)是个向量，则变为(x,y,z,0)</p>
<p>从齐次坐标转换成普通坐标时，<br />
如果是(x,y,z,1)，则知道它是个点，变成(x,y,z);<br />
如果是(x,y,z,0)，则知道它是个向量，仍然变成(x,y,z)</p>
<p>以上是通过齐次坐标来区分向量和点的方式。从中可以思考得知，对于平移T、旋转R、缩放S这3个最常见的仿射变换，平移变换只对于点才有意义，因为普通向量没有位置概念，只有大小和方向，这可以通过下面的式子清楚地看出：</p>
<p><img class="alignnone size-full wp-image-272" title="3" src="http://blog.chuckzhang.net/uploads/2009/09/3.GIF" alt="3" width="270" height="165" /></p>
<p>而旋转和缩放对于向量和点都有意义，你可以用类似上面齐次表示来检测。从中可以看出，齐次坐标用于仿射变换非常方便。</p>
<p>此外，对于一个普通坐标的点P=(Px, Py, Pz)，有对应的一族齐次坐标(wPx, wPy, wPz, w)，其中w不等于零。比如，P(1, 4, 7)的齐次坐标有(1, 4, 7, 1)、（2, 8, 14, 2）、（-0.1, -0.4, -0.7, -0.1）等等。因此，如果把一个点从普通坐标变成齐次坐标，给x,y,z乘上同一个非零数w，然后增加第4个分量w；如果把一个齐次坐标转换成普通坐标，把前三个坐标同时除以第4个坐标，然后去掉第4个分量。</p>
<p>由于齐次坐标使用了4个分量来表达3D概念，使得平移变换可以使用矩阵进行，从而如F.S. Hill, JR所说，仿射（线性）变换的进行更加方便。由于图形硬件已经普遍地支持齐次坐标与矩阵乘法，因此更加促进了齐次坐标使用，使得它似乎成为图形学中的一个标准。</p>
<p><span style="font-size: small;"><strong>简单的线性插值</strong></span></p>
<p>这是在图形学中普遍使用的基本技巧，我们在很多地方都会用到，比如2D位图的放大、缩小，Tweening变换，以及我们即将看到的透视投影变换等等。基本思想是：给一个x属于[a, b]，找到y属于[c, d]，使得x与a的距离比上ab长度所得到的比例，等于y与c的距离比上cd长度所得到的比例，用数学表达式描述很容易理解：</p>
<p><img class="alignnone size-full wp-image-273" title="4" src="http://blog.chuckzhang.net/uploads/2009/09/4.GIF" alt="4" width="111" height="35" /></p>
<p>这样，从a到b的每一个点都与c到d上的唯一一个点对应。有一个x，就可以求得一个y。<br />
此外，如果x不在[a, b]内，比如x &lt; a或者x &gt; b，则得到的y也是符合y &lt; c或者y &gt; d，比例仍然不变，插值同样适用。</p>
<p><strong>透视投影变换</strong><br />
好，有了上面两个理论知识，我们开始分析这次的主角——透视投影变换。这里我们选择OpenGL的透视投影变换进行分析，其他的APIs会存在一些差异，但主体思想是相似的，可以类似地推导。经过相机矩阵的变换，顶点被变换到了相机空间。这个时候的多边形也许会被视锥体裁剪，但在这个不规则的体中进行裁剪并非那么容易的事情，所以经过图形学前辈们的精心分析，裁剪被安排到规则观察体(Canonical View Volume, CVV)中进行，CVV是一个正方体，x, y, z的范围都是[-1，1]，多边形裁剪就是用这个规则体完成的。所以，事实上是透视投影变换由两步组成：<br />
1）  用透视变换矩阵把顶点从视锥体中变换到裁剪空间的CVV中。<br />
2）  CVV裁剪完成后进行透视除法（一会进行解释）。</p>
<p><img class="alignnone size-full wp-image-274" title="5" src="http://blog.chuckzhang.net/uploads/2009/09/5.GIF" alt="5" width="537" height="204" /></p>
<p>我们一步一步来，我们先从一个方向考察投影关系。</p>
<p><img class="alignnone size-full wp-image-275" title="6" src="http://blog.chuckzhang.net/uploads/2009/09/6.GIF" alt="6" width="293" height="299" /></p>
<p>上图是右手坐标系中顶点在相机空间中的情形。设P(x,z)是经过相机变换之后的点，视锥体由eye——眼睛位置，np——近裁剪平面，fp——远裁剪平面组成。N是眼睛到近裁剪平面的距离，F是眼睛到远裁剪平面的距离。投影面可以选择任何平行于近裁剪平面的平面，这里我们选择近裁剪平面作为投影平面。设P’(x’,z’)是投影之后的点，则有z’ = -N。通过相似三角形性质，我们有关系：</p>
<p><img class="alignnone size-full wp-image-276" title="7" src="http://blog.chuckzhang.net/uploads/2009/09/7.GIF" alt="7" width="100" height="66" /></p>
<p>同理，有</p>
<p><img class="alignnone size-full wp-image-277" title="8" src="http://blog.chuckzhang.net/uploads/2009/09/8.GIF" alt="8" width="67" height="26" /></p>
<p>这样，我们便得到了P投影后的点P’</p>
<p><img class="alignnone size-full wp-image-278" title="9" src="http://blog.chuckzhang.net/uploads/2009/09/9.GIF" alt="9" width="158" height="25" /></p>
<p>从上面可以看出，投影的结果z’始终等于-N，在投影面上。实际上，z’对于投影后的P’已经没有意义了，这个信息点已经没用了。但对于3D图形管线来说，为了便于进行后面的片元操作，例如z缓冲消隐算法，有必要把投影之前的z保存下来，方便后面使用。因此，我们利用这个没用的信息点存储z，处理成：</p>
<p><img class="alignnone size-full wp-image-279" title="10" src="http://blog.chuckzhang.net/uploads/2009/09/10.GIF" alt="10" width="164" height="32" /></p>
<p>这个形式最大化地使用了3个信息点，达到了最原始的投影变换的目的，但是它太直白了，有一点蛮干的意味，我感觉我们最终的结果不应该是它，你说呢？我们开始结合CVV进行思考，把它写得在数学上更优雅一致，更易于程序处理。假入能够把上面写成这个形式：</p>
<p><img class="alignnone size-full wp-image-280" title="11" src="http://blog.chuckzhang.net/uploads/2009/09/11.GIF" alt="11" width="216" height="35" /></p>
<p>那么我们就可以非常方便的用矩阵以及齐次坐标理论来表达投影变换：</p>
<p><img class="alignnone size-full wp-image-281" title="12" src="http://blog.chuckzhang.net/uploads/2009/09/12.GIF" alt="12" width="451" height="81" /></p>
<p>其中</p>
<p><img class="alignnone size-full wp-image-282" title="13" src="http://blog.chuckzhang.net/uploads/2009/09/13.GIF" alt="13" width="225" height="82" /></p>
<p>哈，看到了齐次坐标的使用，这对于你来说已经不陌生了吧？这个新的形式不仅达到了上面原始投影变换的目的，而且使用了齐次坐标理论，使得处理更加规范化。注意在把<img class="alignnone size-full wp-image-283" title="14" src="http://blog.chuckzhang.net/uploads/2009/09/14.GIF" alt="14" width="60" height="68" />变成<img class="alignnone size-full wp-image-284" title="15" src="http://blog.chuckzhang.net/uploads/2009/09/15.GIF" alt="15" width="98" height="70" />的一步我们是使用齐次坐标变普通坐标的规则完成的。这一步在透视投影过程中称为透视除法（Perspective Division），这是透视投影变换的第2步，经过这一步，就丢弃了原始的z值（得到了CVV中对应的z值，后面解释），顶点才算完成了投影。而在这两步之间的就是CVV裁剪过程，所以裁剪空间使用的是齐次坐标<img class="alignnone size-full wp-image-285" title="16" src="http://blog.chuckzhang.net/uploads/2009/09/16.GIF" alt="16" width="60" height="68" />，主要原因在于透视除法会损失一些必要的信息（如原始z，第4个-z保留的）从而使裁剪变得更加难以处理，这里我们不讨论CVV裁剪的细节，只关注透视投影变换的两步。矩阵</p>
<p><img class="alignnone size-full wp-image-286" title="17" src="http://blog.chuckzhang.net/uploads/2009/09/17.GIF" alt="17" width="117" height="73" />就是我们投影矩阵的第一个版本。你一定会问为什么要把z写成<img class="alignnone size-full wp-image-287" title="18" src="http://blog.chuckzhang.net/uploads/2009/09/18.GIF" alt="18" width="76" height="32" /></p>
<p>有两个原因：<br />
1）  P’的3个代数分量统一地除以分母-z，易于使用齐次坐标变为普通坐标来完成，使得处理更加一致、高效。<br />
2）  后面的CVV是一个x,y,z的范围都为[-1，1]的规则体，便于进行多边形裁剪。而我们可以适当的选择系数a和b，使得<img class="alignnone size-full wp-image-288" title="19" src="http://blog.chuckzhang.net/uploads/2009/09/19.GIF" alt="19" width="76" height="32" />这个式子在z = -N的时候值为-1，而在z = -F的时候值为1，从而在z方向上构建CVV。</p>
<p>接下来我们就求出a和b：</p>
<p><img class="alignnone size-full wp-image-289" title="20" src="http://blog.chuckzhang.net/uploads/2009/09/20.GIF" alt="20" width="232" height="148" /></p>
<p>这样我们就得到了透视投影矩阵的第一个版本：</p>
<p><img class="alignnone size-full wp-image-290" title="21" src="http://blog.chuckzhang.net/uploads/2009/09/21.GIF" alt="21" width="346" height="86" /></p>
<p>使用这个版本的透视投影矩阵可以从z方向上构建CVV，但是x和y方向仍然没有限制在[-1,1]中，我们的透视投影矩阵的下一个版本就要解决这个问题。</p>
<p>为了能在x和y方向把顶点从Frustum情形变成CVV情形，我们开始对x和y进行处理。先来观察我们目前得到的最终变换结果：</p>
<p><img class="alignnone size-full wp-image-291" title="22" src="http://blog.chuckzhang.net/uploads/2009/09/22.GIF" alt="22" width="98" height="70" /></p>
<p>我们知道-Nx / z的有效范围是投影平面的左边界值（记为left）和右边界值（记为right），即[left, right]，-Ny / z则为[bottom, top]。而现在我们想把-Nx / z属于[left, right]映射到x属于[-1, 1]中，-Ny / z属于[bottom, top]映射到y属于[-1, 1]中。你想到了什么？哈，就是我们简单的线性插值，你都已经掌握了！我们解决掉它：</p>
<p><img class="alignnone size-full wp-image-292" title="23" src="http://blog.chuckzhang.net/uploads/2009/09/23.GIF" alt="23" width="297" height="249" /></p>
<p>则我们得到了最终的投影点：</p>
<p><img class="alignnone size-full wp-image-293" title="24" src="http://blog.chuckzhang.net/uploads/2009/09/24.GIF" alt="24" width="356" height="185" /></p>
<p>下面要做的就是从这个新形式出发反推出下一个版本的透视投影矩阵。注意到<img class="alignnone size-full wp-image-294" title="25" src="http://blog.chuckzhang.net/uploads/2009/09/25.GIF" alt="25" width="98" height="70" />是<img class="alignnone size-full wp-image-295" title="26" src="http://blog.chuckzhang.net/uploads/2009/09/26.GIF" alt="26" width="60" height="68" />经过透视除法的形式，而P’只变化了x和y分量的形式，az+b和-z是不变的，则我们做透视除法的逆处理——给P’每个分量乘上-z，得到</p>
<p><img class="alignnone size-full wp-image-296" title="27" src="http://blog.chuckzhang.net/uploads/2009/09/27.GIF" alt="27" width="312" height="186" /></p>
<p>而这个结果又是这么来的：</p>
<p><img class="alignnone size-full wp-image-297" title="28" src="http://blog.chuckzhang.net/uploads/2009/09/28.GIF" alt="28" width="463" height="207" /></p>
<p>则我们最终得到：</p>
<p><img class="alignnone size-full wp-image-298" title="29" src="http://blog.chuckzhang.net/uploads/2009/09/29.GIF" alt="29" width="545" height="373" /></p>
<p>M就是最终的透视变换矩阵。相机空间中的顶点，如果在视锥体中，则变换后就在CVV中。如果在视锥体外，变换后就在CVV外。而CVV本身的规则性对于多边形的裁剪很有利。OpenGL在构建透视投影矩阵的时候就使用了M的形式。注意到M的最后一行不是(0 0 0 1)而是(0 0 -1 0)，因此可以看出透视变换不是一种仿射变换，它是非线性的。另外一点你可能已经想到，对于投影面来说，它的宽和高大多数情况下不同，即宽高比不为1，比如640/480。而CVV的宽高是相同的，即宽高比永远是1。这就造成了多边形的失真现象，比如一个投影面上的正方形在CVV的面上可能变成了一个长方形。解决这个问题的方法就是在对多变形进行透视变换、裁剪、透视除法之后，在归一化的设备坐标(Normalized Device Coordinates)上进行的视口(viewport)变换中进行校正，它会把归一化的顶点之间按照和投影面上相同的比例变换到视口中，从而解除透视投影变换带来的失真现象。进行校正前提就是要使投影平面的宽高比和视口的宽高比相同。</p>
<p><strong>便利的投影矩阵生成函数<br />
</strong><br />
3D APIs都提供了诸如gluPerspective(fov, aspect, near, far)或者D3DXMatrixPerspectiveFovLH(pOut, fovY, Aspect, zn, zf)这样的函数为用户提供快捷的透视矩阵生成方法。我们还是用OpenGL的相应方法来分析它是如何运作的。<br />
gluPerspective(fov, aspect, near, far)<br />
fov即视野，是视锥体在xz平面或者yz平面的开角角度，具体哪个平面都可以。OpenGL和D3D都使用yz平面。<br />
aspect即投影平面的宽高比。<br />
near是近裁剪平面的距离<br />
far是远裁剪平面的距离。</p>
<p><img class="alignnone size-medium wp-image-299" title="30" src="http://blog.chuckzhang.net/uploads/2009/09/30-300x299.GIF" alt="30" width="300" height="299" /></p>
<p>上图中左边是在xz平面计算视锥体，右边是在yz平面计算视锥体。可以看到左边的第3步top = right / aspect使用了除法（图形程序员讨厌的东西），而右边第3步right = top x aspect使用了乘法，这也许就是为什么图形APIs采用yz平面的原因吧！</p>
<p><span style="font-size: medium;"><strong>OpenGL与D3D的基本差异</strong></span></p>
<p>前面提到，不同API的基本差异导致了最终变换矩阵的不同，而导致OpenGL和D3D的透视投影矩阵不同的原因有以下几个：<br />
（1）       OpenGL默认使用右手坐标系，而D3D 默认使用左手坐标系。</p>
<p>（2）       OpenGL使用列向量矩阵乘法而D3D使用行向量矩阵乘法。</p>
<p><img class="alignnone size-medium wp-image-300" title="1" src="http://blog.chuckzhang.net/uploads/2009/09/1-300x99.jpg" alt="1" width="300" height="99" /></p>
<p>（3）       OpenGL的CVV的Z范围是[-1, 1]，D3D的CVV的Z范围是[0, 1]。</p>
<p>以上这些差异导致了最终OpenGL和D3D的透视投影矩阵的不同。</p>
<p><strong>D3D的透视投影矩阵推导</strong></p>
<p>我们先来看最最基本的透视关系图：</p>
<p><img class="alignnone size-full wp-image-301" title="2" src="http://blog.chuckzhang.net/uploads/2009/09/2.JPG" alt="2" width="220" height="225" /></p>
<p>这里我们考察的是xz平面上的关系，yz平面上的关系同理。这里o是相机位置。np是近裁剪平面，也是投影平面，N是它到相机的距离。fp是远裁剪平面，F是它到相机的位置。p是需要投影的点，p’是投影之后的点。根据相似三角形定理，我们有</p>
<p><img class="alignnone size-full wp-image-302" title="3" src="http://blog.chuckzhang.net/uploads/2009/09/3.JPG" alt="3" width="123" height="26" /></p>
<p>则有</p>
<p><img class="alignnone size-full wp-image-303" title="4" src="http://blog.chuckzhang.net/uploads/2009/09/4.JPG" alt="4" width="292" height="50" /></p>
<p>注意到OpenGL使用右手坐标系，因此应该使用-N，而D3D使用左手坐标系，因此使用N，这是二者的不同点之一。这样，我们得到投影之后的点</p>
<p><img class="alignnone size-full wp-image-304" title="5" src="http://blog.chuckzhang.net/uploads/2009/09/5.JPG" alt="5" width="175" height="55" /></p>
<p>第三个信息点是变换之后的z在投影平面上的位置，也就是N，它已经没用了，我们把p’写成</p>
<p><img class="alignnone size-full wp-image-305" title="6" src="http://blog.chuckzhang.net/uploads/2009/09/6.JPG" alt="6" width="209" height="55" /></p>
<p>从而用第三个没用信息点它来存储z（如果读者对这一点不太了解，请参考上一篇文章）。接下来我们求出a和b，从而在z方向上构建CVV。请注意这里是OpenGL和D3D的另一个不同点，OpenGL的CVV的z范围是[-1, 1]，而D3D的CVV的z范围是[0, 1]。也就是说，D3D 中在近裁剪平面上的点投影之后的点会处于CVV的z=0平面上，而在远裁剪平面上的点投影之后的点会在CVV的z=1平面上。这样我们的计算方程就是</p>
<p><img class="alignnone size-full wp-image-306" title="7" src="http://blog.chuckzhang.net/uploads/2009/09/7.JPG" alt="7" width="270" height="99" /></p>
<p>从而我们得到了透视投影矩阵的第一个版本</p>
<p><img class="alignnone size-medium wp-image-307" title="8" src="http://blog.chuckzhang.net/uploads/2009/09/8-300x101.jpg" alt="8" width="300" height="101" /></p>
<p>即</p>
<p><img class="alignnone size-medium wp-image-308" title="9" src="http://blog.chuckzhang.net/uploads/2009/09/9-300x77.jpg" alt="9" width="300" height="77" /></p>
<p>这个时候第三个分量变换到CVV情形了，CVV的z范围是[0,1]。接下来根据上一篇文章所讲到的，我们要把前两个分量变成CVV情形，CVV的x和y范围是[-1, 1]，如下图所示：</p>
<p><img class="alignnone size-medium wp-image-309" title="10" src="http://blog.chuckzhang.net/uploads/2009/09/10-300x161.jpg" alt="10" width="300" height="161" /></p>
<p>使用线性插值，我们有：</p>
<p><img class="alignnone size-full wp-image-310" title="11" src="http://blog.chuckzhang.net/uploads/2009/09/11.JPG" alt="11" width="168" height="94" /></p>
<p>这里left和right是投影平面的左右范围，top和bottom是投影平面的上下范围。xcvv和ycvv是我们需要算出的在CVV情形中的x和y，也就是我们要计算出的结果。但在算出它们之前，我们先把上面的式子写成：</p>
<p><img class="alignnone size-medium wp-image-311" title="12" src="http://blog.chuckzhang.net/uploads/2009/09/12-300x123.jpg" alt="12" width="210" height="86" /></p>
<p>这里有一个需要注意的地方，如果投影平面在x方向上居中，则</p>
<p><img class="alignnone size-full wp-image-312" title="13" src="http://blog.chuckzhang.net/uploads/2009/09/13.JPG" alt="13" width="113" height="33" /></p>
<p>那么第一个式子就可以销掉等号两边的1/2，写成</p>
<p><img title="14" src="http://blog.chuckzhang.net/uploads/2009/09/14.JPG" alt="14" width="105" height="47" /></p>
<p>同理，如果投影平面在y方向上居中，则第二个式子可以写成</p>
<p><img class="alignnone size-full wp-image-314" title="15" src="http://blog.chuckzhang.net/uploads/2009/09/15.JPG" alt="15" width="112" height="48" /></p>
<p>则我们现在分两种情况讨论：</p>
<p>（1）       投影平面的中心和x-y平面的中心重合（在x和y方向上都居中）<br />
（2）       一般情况</p>
<p>我们分别讨论：</p>
<p><strong>（1）特殊情况方程</strong></p>
<p><img class="alignnone size-full wp-image-315" title="16" src="http://blog.chuckzhang.net/uploads/2009/09/16.JPG" alt="16" width="149" height="115" /></p>
<p>这组是特殊情况，方程比较简单，但也是使用频率最高的方式（这是D3DXMatrixPerspectiveLH、D3DXMatrixPerspectiveRH、D3DXMatrixPerspectiveFovLH、D3DXMatrixPerspectiveFovRH四个方法所使用的情况）。我们导出它：</p>
<p><img class="alignnone size-medium wp-image-316" title="17" src="http://blog.chuckzhang.net/uploads/2009/09/17-300x134.jpg" alt="17" width="206" height="92" /></p>
<p>则我们反推出透视投影矩阵：</p>
<p><img class="alignnone size-medium wp-image-317" title="18" src="http://blog.chuckzhang.net/uploads/2009/09/18-300x87.jpg" alt="18" width="300" height="87" /></p>
<p>其中</p>
<p><img class="alignnone size-full wp-image-319" title="19" src="http://blog.chuckzhang.net/uploads/2009/09/19.JPG" alt="19" width="90" height="84" /></p>
<p>而r-l和t-b可以分别看作是投影平面的宽w和高h。最后那个矩阵就是D3D的透视投影矩阵之一。另外呢，如果我们不知道right、left、top以及bottom这几个参量，也可以根据视野（FOV – Field Of View）参量来求得。下面是两个平面的视野关系图：</p>
<p><img class="alignnone size-medium wp-image-318" title="20" src="http://blog.chuckzhang.net/uploads/2009/09/20-300x130.jpg" alt="20" width="300" height="130" /></p>
<p><img class="alignnone size-medium wp-image-320" title="21" src="http://blog.chuckzhang.net/uploads/2009/09/21-188x300.jpg" alt="21" width="188" height="300" /></p>
<p>其中，两个fov分别是在x-z以及y-z平面上的视野。如果只给了一个视野，也可以通过投影平面的宽高比计算出来：</p>
<p><img class="alignnone size-full wp-image-321" title="22" src="http://blog.chuckzhang.net/uploads/2009/09/22.JPG" alt="22" width="153" height="110" /></p>
<p>用一个视野算出w或者h，然后用宽高比算出h或者w。</p>
<p><strong>（2）一般情况的方程</strong></p>
<p><img class="alignnone size-medium wp-image-322" title="23" src="http://blog.chuckzhang.net/uploads/2009/09/23-300x123.jpg" alt="23" width="220" height="90" /></p>
<p>这组方程比较繁琐，但更具一般性（和OpenGL一般矩阵的推导一致，这也是D3DXMatrixPerspectiveOffCenterLH和D3DXMatrixPerspectiveOffCenterRH两个方法所使用的情况）。我们导出它：</p>
<p><img class="alignnone size-medium wp-image-323" title="24" src="http://blog.chuckzhang.net/uploads/2009/09/24-300x148.jpg" alt="24" width="225" height="111" /></p>
<p>我们继续反推出透视投影矩阵：</p>
<p><img class="alignnone size-medium wp-image-324" title="25" src="http://blog.chuckzhang.net/uploads/2009/09/25-300x191.jpg" alt="25" width="322" height="205" /></p>
<p>其中</p>
<p><img class="alignnone size-full wp-image-325" title="26" src="http://blog.chuckzhang.net/uploads/2009/09/26.JPG" alt="26" width="79" height="73" /></p>
<p>最后那个矩阵就是D3D的一般透视投影矩阵。</p>
<p>好了，目前为止，我们已经导出了D3D的两个透视投影矩阵。下面我把之前导出的OpenGL的透视投影矩阵写出来，大家可以拿它和刚刚导出的D3D的一般性透视投影矩阵做一个对比。</p>
<p><img class="alignnone size-medium wp-image-326" title="27" src="http://blog.chuckzhang.net/uploads/2009/09/27-300x210.jpg" alt="27" width="247" height="173" /></p>
<p>如果仔细观察，可以发现二者在元素的布局上是一个转置的关系，这个就是由它们使用的左右手坐标系以及使用的行列矩阵的差异造成的。而另外在一些元素的细节上也存在着差异，这是由于D3D的CVV的z范围不同造成的。可见在原理相同的情况下，细微的环境差异可以造成非常大的变化，而这就是透视投影矩阵存在诸多不同版本的原因。一般情况的透视投影矩阵也可以使用视野方式来定义，方法和特殊情况相同。</p>

	标签：<a href="http://blog.chuckzhang.net/tags/direct3d/" title="Direct3D" rel="tag">Direct3D</a>, <a href="http://blog.chuckzhang.net/tags/game/" title="Game" rel="tag">Game</a>, <a href="http://blog.chuckzhang.net/tags/opengl/" title="OpenGL" rel="tag">OpenGL</a>, <a href="http://blog.chuckzhang.net/tags/tech/" title="Tech" rel="tag">Tech</a>, <a href="http://blog.chuckzhang.net/tags/%e9%80%8f%e8%a7%86%e6%8a%95%e5%bd%b1/" title="透视投影" rel="tag">透视投影</a><br />
]]></content:encoded>
			<wfw:commentRss>http://blog.chuckzhang.net/2009/09/insideperspectivelh/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

