From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <thellstrom@vmware.com>
Received: from ozlabs.org (ozlabs.org [IPv6:2401:3900:2:1::2])
 (using TLSv1.2 with cipher AECDH-AES256-SHA (256/256 bits))
 (No client certificate requested)
 by lists.ozlabs.org (Postfix) with ESMTPS id 78F881A0699
 for <linuxppc-dev@lists.ozlabs.org>; Thu,  4 Sep 2014 20:24:05 +1000 (EST)
Received: from smtp-outbound-1.vmware.com (smtp-outbound-1.vmware.com
 [208.91.2.12])
 (using TLSv1 with cipher ADH-AES256-SHA (256/256 bits))
 (No client certificate requested)
 by ozlabs.org (Postfix) with ESMTPS id B44FB140116
 for <linuxppc-dev@ozlabs.org>; Thu,  4 Sep 2014 20:24:04 +1000 (EST)
Message-ID: <54083DB4.1050009@vmware.com>
Date: Thu, 4 Sep 2014 12:23:48 +0200
From: Thomas Hellstrom <thellstrom@vmware.com>
MIME-Version: 1.0
To: Benjamin Herrenschmidt <benh@kernel.crashing.org>
Subject: Re: TTM placement & caching issue/questions
References: <1409789547.30640.136.camel@pasglop> <54081844.7000604@vmware.com>
 <20140904093454.GG15520@phenom.ffwll.local>
 <1409823823.4246.61.camel@pasglop>
In-Reply-To: <1409823823.4246.61.camel@pasglop>
Content-Type: text/plain; charset="UTF-8"
Cc: linuxppc-dev@ozlabs.org, dri-devel@lists.freedesktop.org,
 Daniel Vetter <daniel@ffwll.ch>
List-Id: Linux on PowerPC Developers Mail List <linuxppc-dev.lists.ozlabs.org>
List-Unsubscribe: <https://lists.ozlabs.org/options/linuxppc-dev>,
 <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=unsubscribe>
List-Archive: <http://lists.ozlabs.org/pipermail/linuxppc-dev/>
List-Post: <mailto:linuxppc-dev@lists.ozlabs.org>
List-Help: <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=help>
List-Subscribe: <https://lists.ozlabs.org/listinfo/linuxppc-dev>,
 <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=subscribe>

On 09/04/2014 11:43 AM, Benjamin Herrenschmidt wrote:
> On Thu, 2014-09-04 at 11:34 +0200, Daniel Vetter wrote:
>> On Thu, Sep 04, 2014 at 09:44:04AM +0200, Thomas Hellstrom wrote:
>>> Last time I tested, (and it seems like Michel is on the same track),
>>> writing with the CPU to write-combined memory was substantially faster
>>> than writing to cached memory, with the additional side-effect that CPU
>>> caches are left unpolluted.
>>>
>>> Moreover (although only tested on Intel's embedded chipsets), texturing
>>> from cpu-cache-coherent PCI memory was a real GPU performance hog
>>> compared to texturing from non-snooped memory. Hence, whenever a buffer
>>> could be classified as GPU-read-only (or almost at least), it should be
>>> placed in write-combined memory.
>> Just a quick comment since this explicitly referes to intel chips: On
>> desktop/laptop chips with the big shared l3/l4 caches it's the other way
>> round. Cached uploads are substantially faster than wc and not using
>> coherent access is a severe perf hit for texturing. I guess the hw guys
>> worked really hard to hide the snooping costs so that the gpu can benefit
>> from the massive bandwidth these caches can provide.
> This is similar to modern POWER chips as well. We have pretty big L3's
> (though not technically shared they are in a separate quadrant and we
> have a shared L4 in the memory buffer) and our fabric is generally
> optimized for cachable/coherent access performance. In fact, we only
> have so many credits for NC accesses on the bus...
>

Thanks both of you for the update. I haven't dealt with real hardware
for a while..

/Thomas

From mboxrd@z Thu Jan  1 00:00:00 1970
From: Thomas Hellstrom <thellstrom@vmware.com>
Subject: Re: TTM placement & caching issue/questions
Date: Thu, 4 Sep 2014 12:23:48 +0200
Message-ID: <54083DB4.1050009@vmware.com>
References: <1409789547.30640.136.camel@pasglop> <54081844.7000604@vmware.com>
 <20140904093454.GG15520@phenom.ffwll.local>
 <1409823823.4246.61.camel@pasglop>
Mime-Version: 1.0
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: base64
Return-path: <linuxppc-dev-bounces+glppe-linuxppc-embedded-2=m.gmane.org@lists.ozlabs.org>
In-Reply-To: <1409823823.4246.61.camel@pasglop>
List-Unsubscribe: <https://lists.ozlabs.org/options/linuxppc-dev>,
 <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=unsubscribe>
List-Archive: <http://lists.ozlabs.org/pipermail/linuxppc-dev/>
List-Post: <mailto:linuxppc-dev@lists.ozlabs.org>
List-Help: <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=help>
List-Subscribe: <https://lists.ozlabs.org/listinfo/linuxppc-dev>,
 <mailto:linuxppc-dev-request@lists.ozlabs.org?subject=subscribe>
Errors-To: linuxppc-dev-bounces+glppe-linuxppc-embedded-2=m.gmane.org@lists.ozlabs.org
Sender: "Linuxppc-dev"
 <linuxppc-dev-bounces+glppe-linuxppc-embedded-2=m.gmane.org@lists.ozlabs.org>
To: Benjamin Herrenschmidt <benh@kernel.crashing.org>
Cc: linuxppc-dev@ozlabs.org, dri-devel@lists.freedesktop.org, Daniel Vetter <daniel@ffwll.ch>
List-Id: dri-devel@lists.freedesktop.org

T24gMDkvMDQvMjAxNCAxMTo0MyBBTSwgQmVuamFtaW4gSGVycmVuc2NobWlkdCB3cm90ZToKPiBP
biBUaHUsIDIwMTQtMDktMDQgYXQgMTE6MzQgKzAyMDAsIERhbmllbCBWZXR0ZXIgd3JvdGU6Cj4+
IE9uIFRodSwgU2VwIDA0LCAyMDE0IGF0IDA5OjQ0OjA0QU0gKzAyMDAsIFRob21hcyBIZWxsc3Ry
b20gd3JvdGU6Cj4+PiBMYXN0IHRpbWUgSSB0ZXN0ZWQsIChhbmQgaXQgc2VlbXMgbGlrZSBNaWNo
ZWwgaXMgb24gdGhlIHNhbWUgdHJhY2spLAo+Pj4gd3JpdGluZyB3aXRoIHRoZSBDUFUgdG8gd3Jp
dGUtY29tYmluZWQgbWVtb3J5IHdhcyBzdWJzdGFudGlhbGx5IGZhc3Rlcgo+Pj4gdGhhbiB3cml0
aW5nIHRvIGNhY2hlZCBtZW1vcnksIHdpdGggdGhlIGFkZGl0aW9uYWwgc2lkZS1lZmZlY3QgdGhh
dCBDUFUKPj4+IGNhY2hlcyBhcmUgbGVmdCB1bnBvbGx1dGVkLgo+Pj4KPj4+IE1vcmVvdmVyIChh
bHRob3VnaCBvbmx5IHRlc3RlZCBvbiBJbnRlbCdzIGVtYmVkZGVkIGNoaXBzZXRzKSwgdGV4dHVy
aW5nCj4+PiBmcm9tIGNwdS1jYWNoZS1jb2hlcmVudCBQQ0kgbWVtb3J5IHdhcyBhIHJlYWwgR1BV
IHBlcmZvcm1hbmNlIGhvZwo+Pj4gY29tcGFyZWQgdG8gdGV4dHVyaW5nIGZyb20gbm9uLXNub29w
ZWQgbWVtb3J5LiBIZW5jZSwgd2hlbmV2ZXIgYSBidWZmZXIKPj4+IGNvdWxkIGJlIGNsYXNzaWZp
ZWQgYXMgR1BVLXJlYWQtb25seSAob3IgYWxtb3N0IGF0IGxlYXN0KSwgaXQgc2hvdWxkIGJlCj4+
PiBwbGFjZWQgaW4gd3JpdGUtY29tYmluZWQgbWVtb3J5Lgo+PiBKdXN0IGEgcXVpY2sgY29tbWVu
dCBzaW5jZSB0aGlzIGV4cGxpY2l0bHkgcmVmZXJlcyB0byBpbnRlbCBjaGlwczogT24KPj4gZGVz
a3RvcC9sYXB0b3AgY2hpcHMgd2l0aCB0aGUgYmlnIHNoYXJlZCBsMy9sNCBjYWNoZXMgaXQncyB0
aGUgb3RoZXIgd2F5Cj4+IHJvdW5kLiBDYWNoZWQgdXBsb2FkcyBhcmUgc3Vic3RhbnRpYWxseSBm
YXN0ZXIgdGhhbiB3YyBhbmQgbm90IHVzaW5nCj4+IGNvaGVyZW50IGFjY2VzcyBpcyBhIHNldmVy
ZSBwZXJmIGhpdCBmb3IgdGV4dHVyaW5nLiBJIGd1ZXNzIHRoZSBodyBndXlzCj4+IHdvcmtlZCBy
ZWFsbHkgaGFyZCB0byBoaWRlIHRoZSBzbm9vcGluZyBjb3N0cyBzbyB0aGF0IHRoZSBncHUgY2Fu
IGJlbmVmaXQKPj4gZnJvbSB0aGUgbWFzc2l2ZSBiYW5kd2lkdGggdGhlc2UgY2FjaGVzIGNhbiBw
cm92aWRlLgo+IFRoaXMgaXMgc2ltaWxhciB0byBtb2Rlcm4gUE9XRVIgY2hpcHMgYXMgd2VsbC4g
V2UgaGF2ZSBwcmV0dHkgYmlnIEwzJ3MKPiAodGhvdWdoIG5vdCB0ZWNobmljYWxseSBzaGFyZWQg
dGhleSBhcmUgaW4gYSBzZXBhcmF0ZSBxdWFkcmFudCBhbmQgd2UKPiBoYXZlIGEgc2hhcmVkIEw0
IGluIHRoZSBtZW1vcnkgYnVmZmVyKSBhbmQgb3VyIGZhYnJpYyBpcyBnZW5lcmFsbHkKPiBvcHRp
bWl6ZWQgZm9yIGNhY2hhYmxlL2NvaGVyZW50IGFjY2VzcyBwZXJmb3JtYW5jZS4gSW4gZmFjdCwg
d2Ugb25seQo+IGhhdmUgc28gbWFueSBjcmVkaXRzIGZvciBOQyBhY2Nlc3NlcyBvbiB0aGUgYnVz
Li4uCj4KClRoYW5rcyBib3RoIG9mIHlvdSBmb3IgdGhlIHVwZGF0ZS4gSSBoYXZlbid0IGRlYWx0
IHdpdGggcmVhbCBoYXJkd2FyZQpmb3IgYSB3aGlsZS4uCgovVGhvbWFzCgpfX19fX19fX19fX19f
X19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwpMaW51eHBwYy1kZXYgbWFpbGluZyBs
aXN0CkxpbnV4cHBjLWRldkBsaXN0cy5vemxhYnMub3JnCmh0dHBzOi8vbGlzdHMub3psYWJzLm9y
Zy9saXN0aW5mby9saW51eHBwYy1kZXY=