细说板卡

中国计算机报  出版日期:2000-02-02 总期号:156 本年期号:02

返回上一页 声卡收藏图片 显卡收藏图片 影子原创文章 老卡驱动下载 常用工具软件 硬件收藏人物

细说板卡
    编者按:寒假已经到来,很多电脑发烧友都会利用这个假期升级自己的电脑。我们希望通过本专题整理的有关板卡的内容对您能有所帮助。

 

主板篇

  主板作为电脑系统的核心架构产品,一直以来承担着系统的设备连接及数据传输功能。从早期的386、486主板到如今最新的采用i820、amd 750等芯片组的pentium Ⅲ、k7主板,主板产品的发展经历了一个由简单到复杂,由低级到高级的趋势。

    因此,从主板的制造厂商来看,早期的主板制造商的产品性能技术都大同小异,且市面上有umc联华、sis矽统、via威胜、ali扬志等不少芯片组厂商的产品流行,它们的市场份额都差不多,而到了586时代以后,intel的芯片组开始独霸芯片组市场,并把这种优势保持到了pentium ii时代。不过目前由于intel技术上的失误和产品生产线的问题,via、sis等厂商的产品逐渐赶了上来。

  从主板的结构体系来看:传统的芯片组结构采用南北桥的分控体系,南桥芯片上的各种设备都要通过北桥芯片才能和cpu、内存等交换信息,可是目前主板pci总线已不能满足系统信息进行高速有效的传输,于是发展新一代的芯片组架构即成为各大厂商所面临的问题。intel自i810芯片组开始引入加速集线器结构,取代了原有的pci总线,并采用专用总线以连接各设备和cpu,以达到高速处理的目的。而最新i820芯片组则采用了替代北桥芯片的内存控制集线器和替代南桥芯片的i/o控制集线器,其带宽比传统的pci总线速度增加了一倍。这些新型的芯片组采用的专线控制技术缓解了各种设备传输数据时的紧张需求。同时也减小了瓶颈效应,提高了系统的整体传输速度。其他一些新型的控制器还有固件集线器、图形存储控制集线器、音频解码控制器ac97。此外,在最新的i810和i820芯片组中,isa总线插槽被取消了,这无疑是一种技术上的进步,pci插槽将作为基本插槽单位存在于今后的电脑主板产品中。

  从主板的技术特色来看,原来的主板采用的技术特色不多,目前的主板产品多采用以下技术。

    首先我们先看一看主板的核心芯片组技术。记得几年以前,386、486还是主流产品时,市场上主板的芯片组真是数不胜数,其中包括via(威盛)、umc(联华)、sis(矽统)、ali(扬智)等,当初的386用的是mx(茂讯)的芯片组,而后来的486则用的是opti的芯片组。以后的586市场上,由于各芯片组制造商对奔腾技术的不熟悉,使早期的586主板对奔腾的支持不是很好。于是,intel开始自己设计芯片组,使其更好地支持奔腾。“行家一出手,便知有没有。”作为生产cpu的龙头老大,intel果然拥有不同凡响的雄厚实力。在它加入芯片组竞争的短短两年中,其他厂商被杀得零七八落,有很多都转向其他领域的生产去了。intel的芯片组逐渐“一统江湖”,市场份额占到了近90%。

 

1.intel

  intel 的产品经历了430 vx、430 hx、430 tx、440 fx几代,由于年代久远且以上产品现已停产,因此就不再赘述了。 我们从440 lx谈起。440lx以后的芯片组都支持agp图形卡专用接口。真正支持pentium ii,支持dimm内存,支持udma 33硬盘。 经过440 ex 、440bx两代终于推出新的810和820芯片组主板。

  下面我们来看一看这两款芯片组。

 

i810:

  intel终于在低端芯片组市场露一手了。长久以来,人们一直想去尝试生产一种高度整合型芯片组,但不幸的是,过去的这种芯片组在3d性能上总是不尽人意。大部分的整合型芯片组能够胜任商用软件的需求(如文字处理、家庭财经管理、internet浏览等),但是当用户把他们心爱的3d游戏光碟放进cd-rom时,就会发现这些游戏画面的效果看起来像是在看幻灯片而不是像动画片一样的流畅自然。3d性能差的原因源于芯片组的视频工作方式,大部分这类芯片组使用uma(统一内存结构)技术,集成的视频处理单元利用系统主存来作帧缓存。这样,视频存取的速度就将被限制在66mhz的系统主存存取速度上。较慢的显存存取速度再加上这些芯片上集成的很简陋的3d图像处理单元,就造成了很差的3d游戏效果。现在,终于有了intel的810芯片组,它可以用极低的价格来满足用户的需求,同时还能满足3d游戏的较高要求。

  超越过去优秀的“南桥”、“北桥”架构,intel又“发明”了新的“加速中心架构”。老实说到现在我还没真正明白主板上“南桥”和“北桥”的含义,如果你像穆斯林朝拜圣地一样根据南北方向调整你的主板,对我来说那绝对是一个新闻。然而更深的含义在于为什么intel不用这样的名字而改为使用“中心架构”。其中最主要的原因在于在这种架构中,两块芯片不是通过pci总线进行连接,而是利用能提供两倍于pci总线带宽的专用总线。这样,每种设备包括pci总线都可以与cpu直接通讯,intel 810芯片组中的内存控制器和图形控制器也可以使用一条8bit的133mhz“2x模式”总线,使得数据带宽达到266mb/s。代号为camino的intel 820芯片组也将采用这种架构。

  intel 810芯片又称为gmch(graphics & memory controller hub,图形和内存控制中心)。它的名字就说明了它包含内存控制器和2d/3d图形引擎。gmch有三条外置总线和一条内置总线。

 

下面我们就分别来看一看这些技术。

  1. 内存总线

  令人吃惊的是,810芯片组中的内存总线工作频率为100mhz,虽然现在cpu总线只有66mhz。这意味着使用810芯片组的主板要求安装pc100内存,即使你只装配一个66mhz的cpu。内存总线相当快速,具有64bit 100mhz的时钟频率,因而能够提供800mb/s的带宽,比cpu总线533mb/s的带宽大得多。笔者猜想这应该是pc历史上第一次内存比cpu跑得更快吧,谁知道强大的intel是怎么想的?一块cpu使用与cpu时钟同频且最高达466mhz的l2 cache,用它来缓存只有66mhz的cpu总线数据,同时内存可以使用更快达100mhz的总线来传送数据。

  2. gmch和ich之间的连接总线—133mhz

  我们已经谈过它了,图形和内存控制中心使用一条带宽达266mb/s的专用总线与ich(i/o controller hub ,i/o控制中心)连接,这确实很酷。

  3. 内置“直连agp”—100mhz

   这一点你可以想像得到,810芯片组并没有一个外置agp连接,因为图形控制器已经内置在芯片组中了。现在图形控制器从主存中使用纹理数据或从cpu接收几何数据都不成问题,因为内存控制器也是同一个芯片。这样它可以用800mb/s的带宽来全速访问主存,比agp 2x的533mb/s带宽更快。然而,我们不应当忘记810图形的帧缓冲也在主存中,这样800mb/s的带宽与当今超过3200mb/s甚至更大显存带宽的3d图形卡相比就小得相当可怜了。

 
4. 显示缓存总线—100mhz

    810芯片组可选配备4mb大小的显示缓存,这个缓存只能用于3d应用中的z缓冲。现在让我奇怪的是为什么这条总线的带宽只有400mb/s。通常3d图形卡的z缓冲都在显存中,带宽超过3.2gb/s。400mb/s甚至比内存带宽还小,所以我在想810芯片组如何才能使用400mb/s带宽显示缓存,比没有显示缓存而使用带宽为800mb/s的主存作z缓冲来运行3d游戏更快。

  ich

  在“gmch”下面你会发现801芯片—“ich”(i/o controller hub,i/o控制中心)。这个芯片与pci总线上的所有pci设备,包括udma/33或udma/66接口的eide硬盘、usb外设、通过“ac97”连接的modem/音频多媒体数字信号处理器设备及“fwh”( firmware hub,固件中心)连接。ich是所有通往内存、cpu或内置图形控制器的通路,这些设备将共享266mb/s的总线带宽。

  fwh

  “fwh”( firmware hub,固件中心)是一块不少于4mbit的eeprom。它包含了主板和图形控制器的bios,还是一个随机数发生器。intel对这个随机数发生器没有作任何表示,因为目前还没有一个软件能用得上它。

  我们中大多数人都认为810将是“440zx整合i740”,但现在看来不是这样。在前面我已经解释了810芯片组独特的加速中心架构,现在再谈谈它的2d/3d图形性能。810芯片组配置了intel新发布的中低端图形芯片i752芯片的内核,它是迟到了许久的i740芯片的后续者,其最高的3d分辨率是1024×768,而且采用了两条着色流水线。这些特点也许并不太让人兴奋,但810芯片组的确是第一块能在较低价位上提供不错3d性能的2d/3d图形芯片组。笔者想说,不是任何一个3d游戏玩家都会对这块芯片满意,但对于需要一个低价的系统,只是偶尔玩玩3d游戏的用户则是一个不错的选择。

 

i820:

  1999年上半年intel虽连续发布了i810主板芯片组和pentium Ⅲ处理器,但于i810针对低端市场,它内置3d芯片的图形处理功能逊于主流的3d显示芯片,加上它和pentium Ⅲ处理器存在不兼容问题,因而一直不为人看好。而随着amd的600mhz主频的k7处理器的面世, via又推出支持133mhz前端总线的主板芯片组,非intel厂商首次在频率时钟上全面超过intel的中央处理器和芯片组。其间intel计划推出性能强劲的支持133mhz外频的i820芯片组和新pentium Ⅲ处理器,由于种种原因,不断推迟发布日期。尽管最近intel已锁定发布日期,但“跳票”现象继续发生。不过好在不少厂商已推出基于i820芯片组的主板,已有机会让我们一睹i820芯片组的真实面孔。

  开发代号为“camino”的新一代主板支持芯片组i820,这个被intel寄予厚望的芯片组已经几度推迟了发布日期,它的出现将全面替代从440bx芯片组为主导的主流pc市场。i820将在技术规格上完全超越现有的i440bx和i810芯片组,在芯片组结构上采用了intel自行开发的加速中心结构(accelerated hub architecture),在内存结构上则提供对intel定制的新一代内存体系—rambus 的支持。下面我们来看一看i820芯片组的主要技术特征。

 

1.支持drdram

  drdram是由rambus和intel合作开发的一种新型内存,它采用184针接口模组,与芯片组之间的接口宽度为16bit,如果带ecc校验其接口宽度将为18bit。drdram的接口工作频率为400mhz,由于drdram能在时钟信号的上升沿和下降沿各传输一次数据,因此数据传输的频率实际上为800mhz,这样drdram的峰值传输速率可以达到1.6gb/s。由于drdram的核心工作电压为2.5v或1.8v,很多内存芯片制造商在试制800mhz的drdram(即pc800 drdram)时发现,如果要达到drdram技术规范的要求,就必须使用0.18微米甚至更高精度的制造技术,这意味着要投入大量的资金来改造生产线。在这种情况下,intel与rambus公司一起制定了600mhz和700mhz的drdram规范,准备让低档pc使用pc600 drdram,高档pc使用pc700 drdram,工作站使用pc800 drdram,以降低厂商的生产成本和用户的使用成本。不过即便如此,pc600 drdram的市场价格也比现有的pc100 sdram贵许多。因而i820芯片组最后提供了mth桥接芯片,同时提供对drdram与pc100或pc133规范的sdram的支持。

  2.支持agp 4×

  i820是intel第一个支持该标准的芯片组。在66mhz的标准工作频率下,agp 1×和agp 2×的峰值传输速率分别为266mb/s和533mb/s,而agp 4×是agp 2×的两倍,达到了1064mb/s,这个数值是pci总线传输速率的8倍。峰值传输速率的大幅度提高意味着显卡制造商可以推出速度更快功能更强的3d显卡,软件开发商可以开发出更具真实感和实时性的3d软件,如游戏、虚拟现实场景等。为了充分发挥agp 4×的优点,内存的峰值传输速率应该大于agp 4×的峰值传输速率,pc600、pc700和pc800的drdram都满足这个要求,pc133 sdram的最高传输速率为1064mb/s,也可满足要求。看来内存速度对整机性能的影响将会越来越大。内存速度也许将会成为提高pc性能的瓶颈。

3.总线不再支持66mhz

  尽管总线不再支持66mhz,不过主板厂商一般会提供支持。另外,440bx会通过检查cpu金手指的b21引脚来判断总线频率是66mhz还是100mhz。与此情况类似,i820将通过检查cpu的b21和a14引脚来判断总线频率是100mhz还是133mhz。

  4.其他

  i820的i/o控制芯片支持ac97(audio codec 97)和mc97(modem codec 97)标准,通过主板上提供的amr(audio/modem riser)插槽,加入一块集成了音频、modem 解码器的插卡,就可以使主板支持声卡或modem。

  在芯片组结构上,i820和i810芯片组一样,把芯片组分成了内存控制器和i/o控制器两块主要的控制芯片。但是,这两块芯片不像南桥北桥芯片那样,通过pci总线相互连接,而是通过一条两倍于pci带宽的专用总线连接在一起。在加速中心结构下,包括pci总线在内的多种设备直接连接在i/o控制器上,现在这些设备可以与cpu直接交换数据,从而提高了系统的整体工作效率。

   mch(memory controller hub,内存控制中心)相当于原来芯片组结构的北桥芯片,它采用了324针引脚的bga封装方式,通过hub interface(加速中心接口)提供的加速总线结构与其他设备相连。mch的功能也和北桥芯片相似:提供100mhz/133mhz系统总线,支持最大1gb的内存容量,提供agp 4×设备支持。由于i820芯片组的加速中心结构的带宽达到了266mb/s,内存工作频率可以不再依赖于系统频率。这样前端系统总线频率为133mhz的处理器仍然可以使用pc100 sdram,当然总线频率为100mhz的处理器也可以使用pc600、pc700或pc800的drdram。同时因为agp可提供1064mb/s 的数据交流传输率,3d加速卡可以把大容量的纹理数据直接放到系统内存里处理,可以为游戏提供更多更逼真的3d场景。

  mth桥接芯片是为第三方厂商考虑,提供rimm与dimm内存槽的转换接口,通过此芯片的桥接功能,可使i820芯片组支持符合pc100或pc133规范的sdram,从而降低整套系统的成本。mth芯片可以做在sdram的内存条上,也可以用bga封装的方式直接内置在主板上,在mch和dimm内存插槽间起转换作用(直接将sdram转换至drdram的接口形式),由于i820芯片组不支持sdram和drdram两种内存的混插,因而dimm和rimm插槽不能同时使用。

 intel原打算用i820替代440bx,加上“coppermine”的新 pentium Ⅲ来主攻高端pc市场,用i810系列加赛扬的组合来主攻低端pc市场。但同时配备drdram和coppermine处理器的i820系统的价格将会异常昂贵。在目前存在着更多组合的配置解决方案的情况下,早已接受了低价pc概念的广大用户恐怕不会像intel期待的那样迅速转向i820系统。另外,在rambus规范的支持上,以往一呼百应的intel这次却遭遇到了一些厂商强有力的反对。部分厂商不顾intel多次表示的不支持态度,转而开发pc133 sdram、ddrdram等新型内存,他们都不需要对现有dram生产线进行大规模改造。由于生产成本增加有限,因此受到了很多厂商的欢迎。同时兼容芯片组厂商威盛率先开发的apollo pro 133芯片组,支持pc 133 sdram和vcm sdram,这些都给现有主流市场注入新的活力,给intel造成了不小的压力,因而对于i820芯片组的前景仍是难以预料。

  i840:

  1999年中以后,英特尔的日子越来越不好过。先是被athlon夺取了cpu速度之王的称号,接着是i820芯片组的内存问题,然后再加上0.18微米芯片的难产。其中rambus是最引人注目的,它关系到新型内存和i820的推广,如果此问题得不到解决,则会严重阻碍着芯片巨人的前进步伐。

    由于i820芯片组本身设计的问题,它不能支持三条rimm槽,厂商们准备把第三条槽从主板上去掉。虽然rambus的速度比sdram快不少,但总体性能并没有提高太多,而推广i820还会受制于另一个因素即rambus的价格,你愿意花7到8倍的价钱买同样容量的内存吗?

  为了突破以上难关,取得高端市场的领导地位,英特尔终于拿出了它的新型rambus芯片组,即我们期待己久的i840。与旧式芯片组相比,它有几个特点:两个rambus通道(i820只有一个);理论峰值带宽3.2gb/s(pc100和pc133体系分别为0.8gb/s和1gb/s);133mhz外频,它只提供1.06gb/秒的带宽给主内存,真不知道它怎么会这么少,尽管agp 4×总线可以减少内存带宽的需求,但dma驱动程序和uma(unified memory architecture,统一内存架构)都是十分耗费资源的。i840的定位可是服务器市场啊,难道英特尔不怕内存带宽不足而造成的性能瓶颈吗?也许在较低级的工作站市场没有什么问题,不过在使用smp(symmetric multi-processing,对称式多重处理架构)的多处理器系统中,共享mch的情况下,cpu仍然会抢用内存存取空间,即使是运用两个rdram通道同时读/写的方式也对之帮助不大,除非英特尔在后期制作时给mch加入两个内存端口,才有可能避免此类内存带宽大于cpu带宽的浪费。

  虽然i840提供了不少新技术,但真正让我们得益的并不是太多,你不要期望它能为你带来质变,把i840作了bx的升级版本比较合适。除非等到今年第一季度,ia-32结构的willamette芯片上市,只有这类提供200mhz外频的处理器,才能充分发挥2gb/s内存带宽的优势,使其总体性能好于pc200/pc266 ddr sdram(double date rate,双数据率sdram)。

2.AMD

  第一个支持amd k7的主板芯片组就是amd自己研制的750。但由于750研制的时间比较早,一些现在已经非常成熟的技术它并不支持。因此我们希望amd能够赶快推出一种技术更新的芯片组来满足大家的要求。

  我们希望像via一样的公司能开发专门支持amd k7的芯片组。除和第三方芯片组制造商合作以外,amd自己也正在改造750芯片组:750芯片组的北桥芯片增加了一个叫做super pass的功能。

  super pass减少了主存和cpu之间的一些不必要的内存延迟。super pass能减少多少内存延迟?amd自己宣称super pass能减少不小于25%的延迟。对一个芯片组的设计师来说最主要的一个目标之一就是研发一种对于每次处理都能用最小的延迟时间在不同的内部总线中进行数据的交换。

  amd的北桥芯片751负责处理cpu、内存、agp总线和pci总线之间的数据交换。在其他方面,751芯片包括内存请求处理器(mro)。mro包括cpu、内存、agp和pci总线之间的联系。如果没有super pass,mro就得在从主内存发出和得到数据之前进行无数次请求才可以。如果包含了super pass,mro就可以减少部分步骤。为实现super pass的功能,其对agp和pci总线还有一定的要求。据说在正常的系统运转中,super pass在90%~95%的时间里都可以工作。

  也许有人会问为什么amd直到现在才把这项新功能加上。实际上从最开始,750芯片组就将包含super pass,但由于一些技术上的原因并没有实现。

  综上所述,包含super pass 的amd 750芯片组的功能将会有质的飞跃,我们希望amd能加快其投入市场的脚步,以便我们可以尽早地享受到其优秀的性能。

3.via

  via的apollo芯片为socket 7生命的延续做出了巨大的贡献,它打破了intel利用cpu对主板芯片组的垄断。更是在intel抛弃socket 7之后一举成为全球第二大的主板芯片组生产商。

  apollo vpx:早期支持pentium的芯片组。

  apollo vp3:此时intel已经放弃socket 7,并推出agp,迎合这种潮流vp3推出。首次socket 7平台开始支持agp。

  apollo mvp3:随着amd发布k6-2,super 7(socket 7 + 100mhz + agp) 正悄然兴起。mvp3就是vp3的升级版,基本内核不变,支持100mhz。为socket 7平台填上划时代的一笔。

  apollo mvp4:由于intel不断降低slot 1的系统价格,对socket 7市场发起新的冲击。为了维系socket 7的最后生命,via 于去年8月份正式发布了appllo mvp4芯片组。mvp4的北桥芯片采用492脚bga封装,用0.25微米技术生产,最大特点是集成一片符合agp 1.0标准的2d/3d图形处理器,并且该处理器还内建dvd硬件解码引擎(就是现在市场上的trident 9880)。
  南桥芯片采用352脚bga封装,用0.35微米工艺制造。在南桥芯片中集成了一片符合pc97 2.0音效芯片,和super i/o接口界面,而且支持dma/66。并且南桥芯片可以完全移植到slot 1的系统中。
  apollo pro:via第一款支持slot 1系统的芯片组。完全兼容intel 440 bx。并且支持4分频技术。
  apollo pro 133:是apollo pro的升级板。并且真正支持133mhz。以上两种芯片配合mvp4的南桥芯片可以支持dma/66的硬盘。

显卡篇


  下面我们一起来看看板卡中的另一大枝一显示卡。显示卡在过去的一年中可谓竞争惨烈,那么2000年有什么新的动作呢?我们就从每一个显示卡厂商的角度来看一看。

一、nvidia

  1.geforce 256

  nvidia是一个富有挑战性的厂商,当年在3dfx voodoo的狂轰烂炸下nvidia屹立不倒,其推出的riva 128显卡成为了当时挑战voodoo产品的强有力竞争者,并取得了不小的成绩。后来nvidia又推出了革命性的tnt系列,使得其市场份额大大增长。进入1999年,tnt2面市了。其ultra系列的性能大大超过了同类产品,打得对手毫无招架之力。其股票行情也一路飚升,与其他厂商渐渐下滑的行情形成了鲜明对比。面对既已取得的成绩,nvidia并不满足,于1999年9月初nvidia推出采用全新技术、代号为nv10的geforce 256显示芯片。作为nvidia的最新产品,geforce 256的性能在tnt2的基础上大幅提高了。单纯看其像素填充速度和三角形生成率就比后者快了两倍多。显存也从最多32mb到了最多128mb!同样,以前的 agp 4×接口、32位真彩渲染等特色功能也继续保持。此外,geforce 256最大的特点是,它是被作为一个图形处理单元(gpu)来设计的,gpu是一个单芯片处理器。它有完整的转换、光照、三角形设置和渲染引擎(transform、lighting、setup、rendering)等四种3d处理引擎,最小每秒可以产生10m个多边形。如同不少游戏机的图像协处理器一样。内置了gpu的显卡在工作时,一些以前必须由cpu来完成的图形运算工作现在可以由geforce 256 gpu芯片独立完成,从而有效地减轻了cpu的浮点运算负担,减少了对cpu的依赖性。在图形特性方面,geforce 256也拥有强大的技术性能,除了支持各种3d特效外,还可支持诸如hdtv动作补偿、回放缩放等功能,看来geforce 256的多媒体威力也不可小视。
  riva tnt是nvidia公司第一个采用双重纹理的显卡芯片。这种技术可以成倍增加填充速度,对于最新的geforce 256来说,其填充速度可以比旧型tnt显卡高达四倍。而对于256bit渲染引擎来说,这种扩张增加了内部数据总线宽度,在相同时钟频率里可以处理更多的数据,这样就能大大改善显卡的2d性能。

    nvidia为提高画质研究出一种新型技术,以往的显卡技术中,为了使物体图像真实,就不得不大量增加多边形设计,这样就会导致速度下降,而采用较少的多边形呢,画面又很粗糙。geforce 256采用的这种t&l技术其特点是能在不增加物体多边形的前提下,进一步提高物体表面的边缘圆滑程度,使图像更真实、准确、生动。其次,除了变形处理外,光源的作用也是很重要的。传统的光源处理单一呆板,毫无生动感可言,而geforce 256拥有强大的光源处理机能,它在硬件上可以支持8个独立的光源,加上gpu的支持,即时处理的光源将让画面变得更加生动鲜活,真实性也大大提高,可以产生带有反射性质的光源效果。

  环境贴图并不是nvidia独创的,不过有了gpu的协处理,geforce 256可利用立体环境材质贴图技术完全进行硬件加速,从而减轻了cpu的负担,获得完美效果。如最容易出现的球体贴图失真错误情况在geforce 256的工作下就完全没有发生。立体环境材质贴图已经被directx 7.0所支持,看来今后它的用处还是很大的。至于顶点混合在3d特效中也是很重要的,在以前,物体与物体之间的结合处由于缺口和重叠现象,因而看起来总不是很真实,破坏了3d整体效果。而geforce 256采用了一个新的顶点混合技术来处理上述接口,使得物体连接处看起来十分真实,这就达到了3d游戏设计者的基本要求。

  作为最新的3d显卡,geforce 256支持纹理压缩功能和最新的凹凸映射贴图效果,取得了和s3及matrox相同的效果。其中,geforce 256支持5种格式的directx纹理压缩,同时还可支持单通道浮现和点状凹凸映射,大大丰富了材质贴图效果。

2.nv15

  以目前收到厂商的一些资料看来, nv15产品将会配备64mb的显存,拥有比geforce 256更高的填图速率,听说还会加入类似3dfx t-buffer的即时影像数位效果。从显存的64mb高容量与高填图速率的需求下不难发现,nvidia的确正在朝这方面努力。不过到底何时才会发行? 虽然根据厂商的推出产品时间表是在2000年的第二季后。所以nvidia很有可能在今年3dfx推出voodoo4/5的时候拿出nv15一同较量,故我们可能可以在2000千禧年初看到nv15的到来。虽然说geforce 256早在几个月前就发表上市了,但是真正能够发挥geforce 256 的480 m像素/s 的填图速率却要到今年。为什么呢? 因为几乎所有的厂商在这时候才将ddr版本的geforce 256真正抬到市面上。国内的华硕asus v6800,创新creative annihilator pro与丽台 winfast geforce 256 ddr等均是ddr版本的geforce。

3.quadro

  在1999年美国的comdex上,nvidia和elsa就联合展示了一款新的显卡的原型,而他们的目的是想让这卡在商业图形卡市场上也向nvidia在游戏图形加速卡市场上那样的风光无限。但是每一个游戏爱好者都应该知道,nvidia在此之前是没有涉及到此类市场的,在专业图形卡市场中,几乎被evans、sutherland和3dlabs等几个大公司所垄断。正式基于此,nvidia在已经坐稳游戏卡市场的江山后,已经将触角伸向了图形专业卡的市场。打头阵的就是quadro。

     自从comdex以后,我们就很少再听到quadro的消息了,按理说,应该会有很多厂商对这款芯片很感兴趣并且会推出此类产品,但是目前nvidia好像只允许了elsa可以生产基于quadro的显示卡。elsa推出的这块quadro卡装备了64mb的sdram,同时有着专门为cad、3d studios等优化的驱动和完善的open gl驱动。但是卡的性能是否辜负它那高昂的价格还要看看测试。

  nvidia在芯片上印上了quadro的大名。另外,值得一提的是quadro和早前推出的geforce 256并没有很大区别。nvidia只是在芯片内部屏蔽或是激活了一些功能,而使两款芯片在不同的平台上有着不同的表现,但是具体的细节是怎么做的,现在我们还不得而知。但是,我们可以注意到两块芯片的最大不同是在芯片的工作频率上:quadro和geforce 256分别工作在125mhz和120mhz下,而quadro的填充率则突破了500m像素/s的大关,而geforce 256则是480m像素/s。

二、s3

  从savage3d开始,s3走上了复兴之路,初期savage3d以s3tc技术、廉价和bug多闻名于世,导致在diy市场上s3产品成了鸡肋。用户既对savage3d的价格感到满意,又对其兼容性差的问题束手无策,直到savage4出现时局面才有所改观。为了和头号对手nvidia竞争,1999年8月底,s3推出了真正的新产品—savage2000。savage2000是真正的128位显示芯片,其像素填充率高达700m像素/s。savage2000的样卡笔者已拿到,初步测试结果表明其性能略输于geforce 256,但这只是在125/155mhz芯片/显存频率下的结论,可以想象当savage2000的芯片/显存频率提高到200mhz/200mhz时性能将会如何。令人感兴趣的是,savage2000采用0.18微米工艺,所以发热量特别小。笔者的测试样卡上只有一片小小的散热片,在跑完所有的测试程序后触手微温,由此也可以推断savage2000的超频性极好。最诱人的还不止于此。由于savage2000制造成本很低,一些台湾大厂的savage2000显示卡价格只有geforce 256的一半左右,这显然可以吸引许多玩家的购买欲。今年s3重点是全面推行基于savage2000显示芯片产品,以其优秀的性价比夺取更多的市场。

  s3与diamond合并后diamond理所当然就负责销售s3的vga产品。所以我们在这边不能说是savage2000 ultra,而是 viper ii ultra。根据diamond以往的惯例来说,ultra就是更高工作频率的vga产品。那savage2000 ultra版本就是采用savage2000的绘图芯片,但是比原本计划的s2000芯片工作频率还要高。除此之外,viper ii ultra也将配备64mb的显存,以及装备风扇来冷却savage2000绘图芯片所产生的热量。目前并不清楚viper ii ultra会使用哪一种显存。不过笔者猜测viper ii ultra应该不会使用ddr的显存。这是因为64mb的ddr确是一笔很大的开支,不信请看看geforce 256 ddr的价格。比geforce 256 ddr还额外多出32mb的viper ii ultra恐怕无法给玩家一个合理的价格。viper ii ultra计划在今年第一季左右推出,没意外的话将会与voodoo5有一场火拼。

 s3 savage系列的视频回放效果一直是有口皆碑的,s3 savage2000系列继承了s3一向优异的视频播放质量和性能,提供了完善的dvd回放解决方案。这些视频引擎上的优势包括:最新的dynamic multi-tap技术,通过这种动态多附加技术,savage2000可以提供优秀的dvd/dtv回放效果;第三代动态补偿技术,可在减轻cpu负担的同时大幅优化dvd/dtv的播放效果;完全兼容的vip2.0总线,通过这一先进界面,s3 savage2000可以以较低的cpu占用率来支持多dtv的配置;s3 savage2000系列还可选配ntsc/pal电视解码器的数字连接端口和fp解码器的数字连接端口,以扩展各种多媒体应用。

  此外,在最新的s3 savage2000系列中,s3也突破了其传统64位显存接口技术的限制,将其提升到了128位,这意味着无论是在各种分辨率上,都能够获得高速流畅的游戏画面。这是s3系列显卡的一个重大改进。最后,s3 savage200系列还带有8位缓冲,可兼容directx 7和opengl顶点和表格雾化,同时也支持全屏幕反锯齿、硬件凹凸贴图、镜面反光、漫射光影等多种图形特效。看来s3这次是搭上不少血本了。

 三、ati

  显示芯片巨头ati仍然是1999年销量冠军,依靠rage 128gl和rage 128vr芯片,它横扫全球pc品牌机市场,前者是真正的128位芯片,性能介于tnt 2和savage4之间,主攻diy市场;而后者则只有64位显存带宽,性能远不如rage 128gl,但是它有两个好处:一是芯片的针脚与上一代芯片rage pro turbo兼容,因此显卡制造容易升级方便;二是rage 128vr价格十分低廉,比rage pro turbo高不了几美元,因此备受oem厂商欢迎。自从1998年10月发布rage 128芯片以后,除了一个rage 128 pro以外,似乎找不到什么与s3、nvidia等厂商抗衡的产品。在2000年的曙光到来之际,ati也推出了千年之作—rage fury maxx,代号为“曙光女神”。从这个名字上,大家也可看出ati对它寄予了极大的希望。此款产品支持agp4×和s3tc,相当于把两颗rage 128 pro并联在一起工作,性能也相当于rage 128 pro的两倍,像素填充率为500m像素/s,每秒可生成1600万个多边形,这些指标与savage 2000、geforce 256等同类产品都差不多,不过从成本角度上来讲,rage fury maxx比那些竞争对手要稍逊一筹,其显存只能采用2mb×32规格,而且双芯片方案价格可能高于savage 2000、geforce 256。由于ati一向都自己生产芯片并自行生产显示卡,因而rage fury maxx很可能与oem市场无缘,不过我们仍有兴趣看到ati过把“女神瘾”。

 ati一直都想在高端和游戏市场中同时占据领导地位。现在我们可以看到ati又开始朝他的理想努力了。他给我们带来的好消息是广大游戏爱好者可以享用rage fury maxx带来的惊人性能和特性,但是同时一个不好的消息是ati竟然将显卡的设计引向了双芯片集成,这以后可能会引起其他厂商的效仿,这无疑将大大加重卡的成本,从而导致卡的价格的居高不下。

  rage fury maxx在板上集成了两个rage 128 pro芯片,每一块可以使用到32mb显存,每一个芯片的核心频率都是125mhz,并且每一个时钟周期可以处理两个像素。这样一来,在一秒内,maxx的填充率也可以大于500m像素/s。两个芯片一起工作,ati称之为轮流帧渲染。也就是说一块芯片负责处理奇数帧,一块负责处理偶数帧。(听起来有些象voodoo2的sli啊!)。这样设计的优点在于每一块芯片在做一半的工作,同时也就减少了一半的内存带宽。也就是说,可以用目前已经有的技术来达到高速高带宽的要求,而不必使用目前极为昂贵的ddrram来作为解决带宽的办法。这种技术存在一种说法:你是听起来省了钱,用目前的便宜的芯片来达到高速和高带宽的效果,但是你要付出的是2块芯片的价钱,所以2块芯片和2组32mb的内存颗粒的价格已经将其宣称的价格优势丧失殆尽了。而且,你的卡上的64mb显存其实只能当32mb来用,因为两个芯片不共用任何的帧缓存和纹理内存。所有的材质都将在游戏运行的时候通过显存调入,而且在1024x768,32位色的情况下,你还需要6mb的显存来达到这个显示分辨率,也就是说在这个时候,总共要有12mb的显存去做这个事情。换句话说,你所花了64mb显存的钱得到的是比原来32mb显存要大一倍带宽的32mb现存。有关dvd的回放,ati附带了一个ati dvd播放器软件,用起来相当不错,但是由于maxx上面没有电视输出,所以就只能在显示器上欣赏dvd电影了。这块卡目前的价格要2500多人民币,同时也没有什么附带的软件,没有免费的游戏、demo或是其他的一些oem的软件。ati打算在未来降低价格并附送一些软件。也许那时候会更好一些。

 四、matrox 

  自从matrox推出g400以来,就一直是发烧友的宠儿和媒体的焦点。g400最大卖点是环境映射、凹凸贴图和双头显示技术,笔者在使用专为环境映射、凹凸贴图技术优化过的游戏测试时,感觉画面效果确实很棒,可以用“凹凸尽现”几个字来形容。不过这类游戏到目前为止尚属凤毛鳞角,以后会不会有更多佳作涌现,还是一个很大的问号。

  matrox g400 max作为g400的增强版本,其速度性能自然不低,而g400 max和g400之间的区别主要在于时钟频率和填充率的不同。g400 max的填充率为330m像素/s,时钟频率设置为165mhz,使用5ns sgram芯片。而一般的g400的填充率为254m像素/s,时钟频率设置为127mhz,使用6ns sgram芯片。g400max芯片不但继承了g400的传统特性,而且还具有360mhz的ramdac,速度比普通的g400要快30%。

    g400 max(g400)的双头显示技术是一种先进的硬件技术,它通过windows 98多屏显示功能,利用双头显示技术取代两块显卡工作,达到一种两块显示卡同时显示的效果。双头显示技术可以将两个同时发生但各自独立输出的图像显示到两个不同的显示设备上,这些设备包括两台普通crt显示器、一台crt和一台电视机,或者是一台crt和一台lcd显示器等。由于两路视频具有独立的处理及数模转换功能,所以将信号输出到电视时可独立调节各设备上的刷新率、分辨率及色彩深度。其中第二个屏幕最高支持1280×1024/32bit@60hz的模式,而采用g400 max更可以同时以360mhz ramdac的效果显示,避免了画质下降的情况出现。

  在真实世界中,物体表面大多是不光滑的,所以需要通过凹凸模拟技术来体现物体所具有的特殊曲面。传统的3d显卡多采用浮雕(emboss)效果来近似地实现凸凹映射,这种浮雕效果的逼真程度十分有限,难以显示细微的棱角处的反光效果和复杂的多环境光源效果,也无法表现水波和气流等特殊效果。此时,环境映射凸凹贴图就很重要了。作为新的硬件级凸凹映射标准,它可以更精确地建立光照、阴影与表面高度之间的映射关系,从而逼真地模拟了真实环境中的凸凹效果。如今已经开始有一些游戏支持这一特效了。

  g400 max也具备了许多新一代3d图形加速卡的特征,如双渲染流水线。这种技术可在单时钟周期内完成两个纹理的处理,从而实现了单周期多重纹理效果。此外,g400 max采用了第二代明亮色彩着色(vcq2)技术,利用全32位精度的内部流水线,通过增加精度和内部管道缓冲来降低渲染过程中的累计误差和抖动失真,使色彩层次细腻逼真。同时,g400 max采用8位滤波系数,提供了高质量的各向异性等多种过滤模式,使得纹理渲染的精度得到极大的提高。最后,g400 max还实现了32位z缓冲等多种技术,提高了游戏画面的质量,强化了专业3d应用。

  g400及其贵族型产品g400 max在玩d3d游戏时速度很快,和nvidia的旗舰产品tnt2 ultra的速度在伯仲之间,令人惊叹的是g400在使用最新驱动程序后玩quake3等使用opengl的游戏时,测试成绩已超过了号称速度之王的geforce 256,可见g400的潜力是非常巨大的。看上去g400似乎不需接班人就可以和新生代抗衡了。今年matrox将推出一款具有较高性价比的产品,用来主攻oem市场的g450显示芯片。g450采用0.18微米生产工艺制造,性能保持在g400同一条水平线上,但价格只有10多美元,和savage4 pro+以及m64差不多。matrox的g400系列由于价格因素导致oem市场份额丢失殆尽,如果g450能按时推出,相信matrox又能抢回不少应该属于自己的市场。而前一阵传得沸沸扬扬的matrox公司将于今年推出g800显示芯片的消息,被证实是子虚乌有。虽然以g400现有的实力,仍有机会在今年的芯片市场一搏,不过从g100开始,opengl性能就再也不是matrox的强项了。

五、3dfx

  3dfx产品在voodoo、voodoo2时代一直被广大用户所看好,它们的画质和速度让广大发烧友垂涎不已。大家本来都对voodoo 3寄予了厚望,可没想到它让人失望。好在11月15日的comdex展上, 3dfx正式发布下一代加速芯片产品,代号“napalm”。napalm虽然没有像geforce 256那样有重大的革新,提出了t&l等解决方案, 但光像素填充率就足以让人感受到其强大的实力, 这将是首块突破1g/s的3d加速卡,与同级的geforce 256 480m像素/s、savage 2000 500m像素/s、ati rage maxx 500m像素/s相比,napalm的填充率是它们的两倍以上。

    3dfx在vsa-100处理器的芯片名称上拿掉了voodoo的名字,它有一些会令游戏玩家有兴趣的功能。首先,vsa-100支持32位色,它所有对手几乎都有这功能好一阵子了。第二,3dfx又回头用起它的交错式描线(sli)技术来做使用多个vsa-100的显示卡,它可以让游戏软件有两倍和4倍的填充速度,新的sli 技术将可以做出有32颗芯片的系统。

  玩家们大概不会这么快想买一块有32颗vsa-100芯片的卡,3dfx已经允许quantum 3d制造具有这样威力的卡,像这样一片有128mb~2gb显存的家伙,可以达到3gpixel/s。不幸的是,这样的卡锁定的是专业绘图以及军事领域,像这样一片配备全32颗芯片,2gb显存的卡大概要40000美元,玩家们最好三思。

  不过3dfx似乎并没有考虑显存带宽的问题,napalm的显存接口将会是256bit的吗? 即便这样napalm也需要很快的显存才不致于限制像素填充率。要知道,虽然savage 2000拥有比geforce 256更高的像素填充率,但显存速度略慢是savage 2000在测试中落后于geforce 256的根本原因。

  napalm将对dxtc有良好支持。看来在direct x7.0发布后, 纹理压缩将被广泛应用于游戏中。从现在公布的一些预发行游戏中, 预计支持s3tc及dxtc的游戏已达15~20款。由于现在大部分游戏均基于d3d设计,所以dxtc将得到非常好的应用。由于3dfx也发布了公开源代码的fxt1纹理压缩技术,其压缩还原技术在dxtc及s3tc之上,而且可借助glide得到充分发挥,这也是未来3dfx的优势之一。不过关键是游戏厂商是否还愿意专为glide做优化了。

    napalm似乎没有什么缺点了。32bit渲染、t-buffer、纹理压缩等等,可以预见利用这些技术可使现有的游戏画面质量有一定提升。在短期内,如果没有支持t&l的游戏推出,那么napalm无论在画质还是速度方面都将比geforce 256胜一筹,也许这就是3dfx 吧! 毕竟是一个最具影响力的图形芯片公司, 对市场的分析也更透彻些,因为要让游戏厂商支持t-buffer比支持t&l要容易得多。也许nvidia过于乐观了,过份相信了gpu的能力,但现实是残酷的, geforce 256在图像方面的提升是非常有限的,这在一方面影响了用户从tnt2升级到geforce的欲望。

  总之,各大厂商之间的竞争,一方面大大促进3d显示技术的飞速发展,另一方面必将进一步淘汰产品开发滞后的厂商。市场的格局将进一步地发生改变,但孰优孰劣、谁主浮沉,目前尚难预料,不过对于用户,拥有性价比更高的产品才是最重要的。

QQ:50410629 影子传说  欢迎您访问 www.ssstjy.com