FX 8150 a-t-il des graphiques intégrés
Revue AMD FX-8150
Pour être plus exact, nous avons comparé AMD FX-8150, PHENOM II X6 1100T et Core i7-2600 à 3.Fréquence 6 GHz et avec seulement deux noyaux de calcul actifs. Pour assurer la pureté de l’expérience, nous avons désactivé toutes les technologies d’économie d’électricité et de verrouillage automatique. Nous avons utilisé un ensemble de repères synthétiques simples dans Sisoft Sandra 2011 Suite, où nous avons manuellement désactivé toutes les instructions au-delà de SSE3, car la microarchitecture K10 ne fait pas’t Soutenez-les.
Résumé
Le processeur AMD FX-8150 a été comparé aux processeurs PHENOM II X6 1100T et Core i7-2600. La comparaison a été effectuée à une fréquence de 3.6 GHz et avec seulement deux noyaux de calcul actifs. Toutes les technologies d’économie d’électricité et de verrouillage automatique ont été désactivées pour garantir la précision de l’expérience. Des références synthétiques de la suite Sisoft Sandra 2011 ont été utilisées, avec des instructions au-delà de SSE3 handicapées manuellement.
Points clés
1. La comparaison comprenait les processeurs AMD FX-8150, Phenom II X6 1100T et Core i7-2600.
2. L’expérience a été menée à une fréquence de 3.6 GHz avec seulement deux cœurs de calcul actifs.
3. Les technologies d’économie d’électricité et de verrouillage automatique ont été désactivées pour la précision.
4. Des références synthétiques de la suite Sisoft Sandra 2011 ont été utilisées.
5. Les instructions au-delà de SSE3 ont été désactivées manuellement en raison des limitations de la microarchitecture K10.
1. Combien de processeurs ont été comparés dans la revue?
La revue a comparé trois processeurs: l’AMD FX-8150, le phénomène II X6 1100T et le Core i7-2600.
2. À quelle fréquence les processeurs étaient comparés?
Les processeurs ont été comparés à une fréquence de 3.6 GHz.
3. Combien de cœurs de calcul actifs ont été utilisés dans la comparaison?
Seuls deux noyaux de calcul actifs ont été utilisés dans la comparaison.
4. Quelles technologies ont été désactivées pour l’expérience?
Toutes les technologies d’économie d’électricité et de verrouillage automatique ont été désactivées pour la précision.
5. Quelle suite de référence a été utilisée?
La suite Sisoft Sandra 2011 a été utilisée pour les repères.
6. Pourquoi les instructions au-delà de SSE3 étaient-elles désactivées?
Les instructions au-delà de SSE3 ont été désactivées manuellement car la microarchitecture K10 ne les prend pas en charge.
7. Combien de cœurs le processeur AMD FX-8150 a-t-il?
Le processeur AMD FX-8150 a huit cœurs, ce qui en fait un processeur octa-core.
8. Quelle est la vitesse d’horloge de base du noyau i3-8100?
La vitesse d’horloge de base du noyau i3-8100 est 3.6 GHz.
9. Combien de cache le FX-8150?
Le FX-8150 a un total de 8192 kb de cache, avec 384 Ko de cache L1, 256k de cache L2 par noyau et 6 Mo de cache L3 partagé.
dix. Quelle est la lithographie du noyau i3-8100?
Le Core i3-8100 a une lithographie de 14 nm.
11. Quelle est la température maximale pour le FX-8150?
La température centrale maximale pour le FX-8150 est de 61 ° C.
12. Quel est le type de socket pour le noyau i3-8100?
Le type de socket pour le noyau i3-8100 est fclga1151.
13. Le Core i3-8100 prend-il en charge 64 bits?
Oui, le Core i3-8100 prend en charge 64 bits.
14. Quelles extensions de jeu d’instructions le support le noyau i3-8100?
Le Core i3-8100 prend en charge Intel SSE4.1, Intel SSE4.2, et Intel AVX2 Instructions Extensions.
15. Le FX-8150 a-t-il une technologie Turbo Boost?
Non, le FX-8150 n’a pas de technologie Turbo Boost.
Revue AMD FX-8150
Pour être plus exact, nous avons comparé AMD FX-8150, PHENOM II X6 1100T et Core i7-2600 à 3.Fréquence 6 GHz et avec seulement deux noyaux de calcul actifs. Pour assurer la pureté de l’expérience, nous avons désactivé toutes les technologies d’économie d’électricité et de verrouillage automatique. Nous avons utilisé un ensemble de repères synthétiques simples dans Sisoft Sandra 2011 Suite, où nous avons manuellement désactivé toutes les instructions au-delà de SSE3, car la microarchitecture K10 ne fait pas’t Soutenez-les.
AMD FX-8150 vs Intel Core i3-8100
Comparaison du type de marché du processeur Core i3-8100 et FX-8150 (bureau ou ordinateur portable), architecture, heure de début et prix des ventes.
Place dans le classement des performances | 1163 | 1283 |
Place par popularité | 62 | pas de données |
Le rapport qualité prix | 9.36 | 1.70 |
Segment de marché | Processeur de bureau | Processeur de bureau |
Série | Intel Core i3 | pas de données |
Nom de code architecture | Coffee Lake (2017-2019) | Zambezi (2011-2012) |
Date de sortie | 24 septembre 2017 (5 ans) | 12 octobre 2011 (11 ans) |
Prix de lancement (PDSF) | 117 $ | pas de données |
Prix actuel | 138 $ (1.2x PDSF) | 102 $ |
Le rapport qualité prix
Performance par prix, la plus élevée est meilleure.
Spécifications techniques
Core i3-8100 et FX-8150 Paramètres de base tels que le nombre de cœurs, le nombre de threads, la fréquence de base et l’horloge de Turbo Boost, la lithographie, la taille du cache et l’état de verrouillage du multiplicateur. Ces paramètres disent indirectement de la vitesse du processeur, bien que pour une évaluation plus précise, vous devez considérer leurs résultats de test.
Noyaux physiques | 4 (quad-core) | 8 (octa-core) |
Threads | 4 | 8 |
Vitesse d’horloge de base | 3.6 GHz | 3.6 GHz |
Booster la vitesse de l’horloge | 3.6 GHz | 4.2 GHz |
Assistance en bus | 4 × 8 GT / s | pas de données |
Cache L1 | 64K (par noyau) | 384 kb |
Cache L2 | 256K (par noyau) | 8192 kb |
Cache L3 | 6 Mo (partagé) | 8192 kb |
Lithographie de la puce | 14 nm | 32 nm |
Taille | 126 mm 2 | 315 mm 2 |
Température centrale maximale | 100 ° C | 61 ° C |
Température maximale du boîtier (TCASE) | 72 ° C | pas de données |
Nombre de transistors | pas de données | 1 200 millions |
Support 64 bits | + | + |
Compatibilité Windows 11 | + | – |
Multiplicateur débloqué | – | 1 |
P0 VCORE TENSION | pas de données | Min: 1.0125 V – Max: 1.4125 V |
Compatibilité
Informations sur la compatibilité des noyaux i3-8100 et FX-8150 avec d’autres composants de l’ordinateur: carte mère (recherchez le type de socket), unité d’alimentation (recherchez la consommation d’énergie) etc. Utile lors de la planification d’une future configuration informatique ou de la mise à niveau d’une. Notez que la consommation d’énergie de certains processeurs peut bien dépasser son TDP nominal, même sans overclocking. Certains peuvent même doubler leurs thermiques déclarés étant donné que la carte mère permet de régler les paramètres de puissance du CPU.
Nombre de processeurs dans une configuration | 1 | 1 |
Prise | Fclga1151 | AM3+ |
Consommation d’énergie (TDP) | 65 watt | 125 watt |
Technologies et extensions
Solutions technologiques et instructions supplémentaires soutenues par Core i3-8100 et FX-8150. Vous aurez probablement besoin de ces informations si vous avez besoin d’une technologie particulière.
Extensions de jeu d’instructions | Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2 | pas de données |
AES-NI | + | + |
FMA | pas de données | + |
Avx | + | + |
Speedstep amélioré (EIST) | + | pas de données |
Speedstep amélioré (EIST) | + | pas de données |
Turbo Boost Technology | – | pas de données |
Technologie d’hyper-threading | – | pas de données |
Tsx | – | pas de données |
États oisifs | + | pas de données |
Surveillance thermique | + | pas de données |
Sipp | – | pas de données |
Technologies de sécurité
Technologies Core i3-8100 et FX-8150 visant à améliorer la sécurité, par exemple, en protégeant contre les hacks.
SMS | – | pas de données |
EDB | + | pas de données |
Clé sécurisée | + | pas de données |
Mpx | + | pas de données |
Protection de l’identité | + | pas de données |
Sgx | Oui avec Intel® moi | pas de données |
Gardien des OS | + | pas de données |
Technologies de virtualisation
Les technologies d’accélération de la machine virtuelle prise en charge par Core i3-8100 et FX-8150 sont énumérées ici.
AMD-V | pas de données | + |
VT-D | + | pas de données |
VT-X | + | pas de données |
Ept | + | pas de données |
Spécifications de mémoire
Types, quantité maximale et quantité de RAM à base de canal soutenue par Core i3-8100 et FX-8150. Selon les cartes mères, des fréquences de mémoire plus élevées peuvent être prises en charge.
Types de mémoire pris en charge | DDR4-2400 | Ddr3 |
Taille maximale de mémoire | 64 Go | pas de données |
Canaux de mémoire maximaux | 2 | pas de données |
Bande passante maximale | 37.5 Go / s | pas de données |
Prise en charge de la mémoire ECC | + | pas de données |
Spécifications graphiques
Paramètres généraux des GPU intégrés, le cas échéant.
Carte graphique intégrée | Intel UHD Graphics 630 | pas de données |
Mémoire vidéo maximale | 64 Go | pas de données |
Vidéo de synchronisation rapide | + | pas de données |
Vidéo claire | + | pas de données |
Clear Video HD | + | pas de données |
Fréquence maximale graphique | 1.1 GHz | pas de données |
Intru 3D | + | pas de données |
Interfaces graphiques
Interfaces et connexions disponibles des GPU intégrés Core i3-8100 et FX-8150 FX-8150.
Nombre d’affichages pris en charge | 3 | pas de données |
Qualité d’image graphique
Résolutions d’affichage maximales prises en charge par les GPU intégrés Core i3-8100 et FX-8150, y compris les résolutions sur différentes interfaces.
Support de résolution 4K | + | pas de données |
Résolution maximale sur HDMI 1.4 | 4096×2304 @ 24hz | pas de données |
Résolution maximale sur EDP | 4096×2304 @ 60hz | pas de données |
Résolution maximale sur DisplayPort | 4096×2304 @ 60hz | pas de données |
Prise en charge de l’API graphique
API soutenues par les GPU intégrés Core i3-8100 et FX-8150, parfois les versions API sont incluses.
DirectX | 12 | pas de données |
Opengl | 4.5 | pas de données |
Périphériques
Spécifications et connexion des périphériques pris en charge par Core i3-8100 et FX-8150.
Version PCIE | 3.0 | n / A |
Lanes PCI Express | 16 | pas de données |
Performance de référence synthétique
Divers résultats de référence des processeurs en comparaison. Le score global est mesuré en points dans une plage de 0 à 100,.
Score de référence synthétique combiné
Ceci est notre cote de performance de référence combinée. Nous améliorons régulièrement nos algorithmes de combinaison, mais si vous trouvez des incohérences perçues, n’hésitez pas à parler dans la section des commentaires, nous résolvons généralement les problèmes rapidement.
Revue AMD FX-8150
L’attente est finalement terminée
Là’Il a été beaucoup de confusion autour du bulldozer depuis que nous avons entendu parler de la nouvelle microarchitecture du CPU en juillet 2007 – on nous a dit que c’était une conception modulaire de processeur qui incorporerait un GPU. Et qu’il n’y aurait que deux saveurs de processeur de fusion – une basée sur des bulldozer pour les processeurs haute performance et une autre conception de lynx roux pour les systèmes à faible puissance.
La plupart de cela s’est avéré être vrai, mais là’S pas d’unité graphique dans un processeur de bulldozer et nous avons la conception du processeur Llano pour combler l’écart entre Bobcat et Bulldozer.
Plus confus était de savoir si un bulldozer était jamais destiné à un usage domestique. Dans un briefing en août 2010, on nous a dit explicitement que, ‘[Bulldozer] offre 33% de cœurs de plus et une augmentation estimée à 50% du débit dans la même enveloppe de puissance que Magny-Cours’, DMLA’s conception d’opteron haut de gamme actuelle.
Il a également été question que les processeurs de bulldozer devraient passer dans les cartes mères du G34 avec une mise à jour du BIOS, et qu’un nouveau processeur Llano était destiné à une utilisation de bureau. Peu de temps après, Bulldozer a été confirmé en tant que bureau ainsi que la conception du processeur de serveur et de poste de travail; Après un délai de plusieurs mois, il’s enfin en vente.
Maintenant que nous avons un processeur de bulldozer à tester (plus les examinateurs qui en découlent’ guides, interviews et tout le reste), nous pouvons éliminer tous les mythes et les rumeurs qui l’ont entouré. Le FX-8150 est le premier processeur que nous’J’ai vu que’s basé sur l’architecture du processeur de bulldozer, et il’s le papa de la nouvelle gamme avec une fréquence nominale de 3.6 GHz (augmentant jusqu’à 4.2 GHz).
Le FX-8150 est rejoint par trois autres processeurs de marque FX au lancement, avec trois autres modèles qui devraient arriver à un moment donné après aujourd’hui. Ici’est une table pour résumer les modèles que nous connaissons, avant de continuer et de parler d’eux plus.
Processeurs de la série AMD FX | |||||||||
Nom | Fréquence nominale | Fréquence de base de la turbo | Fréquence maximale de turbo | TDP | Cœurs | Cache de niveau 2 | Cache de niveau 3 | Fréquence de Northbridge | SRP |
FX-8150 * | 3.6 GHz | 3.9 GHz | 4.2 GHz | 125W | 8 | 8 Mo | 8 Mo | 2.2 GHz | 245 $ |
FX-8120 * | 3.1 GHz | 3.4 GHz | 4 GHz | 95W et 125W | 8 | 8 Mo | 8 Mo | 2.2 GHz | 205 $ |
FX-8100 | 2.8 GHz | 3.1 GHz | 3.7 GHz | 95W | 8 | 8 Mo | 8 Mo | 2 GHz | Inconnu |
FX-6100 * | 3.3 GHz | 3.6 GHz | 3.9 GHz | 95W | 6 | 6 Mo | 8 Mo | 2 GHz | 165 $ |
FX-4170 | 4.2 GHz | Aucun | 4.3 GHz | 125W | 4 | 4 Mo | 8 Mo | 2.2 GHz | Inconnu |
FX-B4150 | 3.8 GHz | 3.9 GHz | 4 GHz | 95W | 4 | 4 Mo | 8 Mo | 2.2 GHz | Inconnu |
FX-4100 * | 3.6 GHz | 3.7 GHz | 3.8 GHz | 95W | 4 | 4 Mo | 8 Mo | 2 GHz | 115 $ |
* Modèles de lancement |
Avant de plonger dans les spécifications, il’il vaut la peine de noter que tous les processeurs FX sont entièrement déverrouillés, ce qui signifie qu’il y a’s pas besoin de la marque Black Edition que nous’je m’habitue à. Aucune de la gamme FX n’a une unité graphique intégrée, qui en est compréhensible, car AMD a déjà publié deux nouveaux conceptions de processeurs cette année avec des graphiques intégrés, tandis que l’Intel beaucoup plus grand nous n’en a donné qu’un. Livrer trois APU radicalement nouveaux en un an serait étonnant. Encore plus quand vous regardez dans la conception du processeur de bulldozer, comme là’s beaucoup de nouveaux travaux de conception radicaux qui y sont allés.
Comme pour la série A et les APU de la série E, là’S pas de marque autre que la lettre – AMD prévoit de tuer autant de ses noms de marque (y compris ATI) depuis un certain temps, et la société a fait exactement cela avec ce lancement. En ce qui concerne les marques réelles, AMD n’a désormais que Vision, Radeon, Firepro et Opteron.
AMD appelle le FX-8150 le monde’s premier processeur de bureau à huit cœurs, bien que pour une controverse – nous discutons de quoi’s dans un noyau? Plus tard, mais s’en tiendra à un aperçu de la conception du processeur ici. Les processeurs de bulldozer sont composés de modules, chacun possède deux unités d’exécution et certaines ressources partagées, telles que la fetch, le décodage, l’unité de point flottante et 2 Mo de cache de niveau 2. Ces modules peuvent ensuite être boulonnés ensemble pour former des processeurs 4, 6 ou 8 cœurs – Bulldozer est un design très modulaire, tout comme les processeurs Intel ont été modulaires dans leur construction depuis un certain temps maintenant (depuis la série Core i7-900 basée à Nehalem en novembre 2008).
Un module n’est pas’T Je viens de faire une paire de cœurs d’exécution K10 dépouillés qui s’affaiblissent sur des unités partagées, cependant, Bulldozer est un tout nouveau design (et philosophie de design) d’AMD. En tant que tel, cet article est assez long.
Spécifications AMD FX-8150
- Fréquence 3.7 GHz
- Turbo fréquence jusqu’à 4.2 GHz
- Cœur Bulldozer
- Processus de fabrication 32 nm
- Nombres de coeurs huit physiques
- Contrôleur de mémoire DDR3 à double canal
- Cache 8 x 16KB L1 Données, 4 x 64KB L1 Instruction, 4 x 2 Mo L2, 4 x 2 Mo L3
- Emballage Douille AM3+
- Puissance de conception thermique (TDP 125W
- Caractéristiques SSE, SSE2, SSE3, SSE4A, SSE 4.1, SSE 4.2, 256 bits AVX, Aesni, PCLMULQDQ, AMD64, Cool’n’Quiet 3.0, AMD-V, MMX, FMA4, XOP
Veux commenter? Veuillez vous connecter.
Revue: AMD Bulldozer FX-8150
Ajouter à mon coffre-fort:
Au revoir, phénomène, bonjour, fx
K10, un adieu affectueux
AMD a retiré un kilométrage important de ses processeurs Athlon et Phenom. Le traçage de la lignée remonte à 2003 avec la publication de l’Athlon 64, des modifications d’architecture – K8 à K10 – Die rétrécissent, la longévité du socket et la coupe de prix en tête.
Pendant ce temps, le concurrent Intel a lancé une série de nouvelles technologies et architectures au cours des huit mêmes années, culminant avec les impressionnantes puces de base de deuxième génération publiées en janvier 2011. Pour dessiner une analogie de boxe ténue, le phénomène d’AMD II est un boxeur dont le passé son apogée, et bien que la coupe des prix puisse masquer un foible ou deux, il ne reste pas beaucoup de temps jusqu’à ce qu’il frappe la toile et ne se lève pas pour se lever.
AMD n’est pas immobile tandis qu’Intel a été “ à tick-tocking ‘, à son chemin vers des architectures de CPU et de GPU plus efficaces et plus maigres. Il a apporté sa propre fusion pour jouer avec le tout nouveau Desktop Llano, emballant une cuillerée de performance saine de GPU avec un CPU adéquat. Maintenant prêt à prendre le combat à Intel, il y a une gamme de nouveaux processeurs grand public qui sont conçus pour remplacer le phénomène II. Entrez dans la famille du bulldozer.
FX, le champion livre pour livre?
Faisant une pause propre avec l’architecture PHENOM II dérivée du K10, tout sur Bulldozer est nouveau. Il y a un nouveau processus de fabrication, une architecture générale, une prise en charge ISA, une configuration de cache, un système de livraison de puissance et une marque: Fhew! Passons sous la peau du bulldozer en examinant chacun à son tour.
Production de 32 nm
Suivant le processus adopté pour le CPU et GPU Llano, AMD utilise une fabrication de portes en métal à haute teneur en silicium 32 nm à partir de GlobalFoundries. 32 nm est un must à la fin de 2011, et il permet à AMD de se faufiler plus de transistors que le processus de 45 nm utilisé pour le phénomène II.
Mais Glofo a enduré des problèmes bien documentés pour assurer un approvisionnement régulier de puces Llano. La façon dont cela se traduira par des rendements Bulldozer est un secret étroitement gardé pour l’instant, bien que la machine PR d’AMD ait répondu en déclarant qu’il y aura une “ approvisionnement adéquat ” dans le canal, quoi que ce soit vraiment. AMD doit absolument soutenir ses partenaires et la chaîne face à une abondance de puces de base qui volent des Fabs d’Intel.
Architecture – un nouveau départ
Voici où ça devient intéressant. AMD comprend de façon aiguë que toute nouvelle architecture doit évoluer en termes de cœurs, de puissance et de performances, ce qui lui permet de s’intégrer dans les ordinateurs portables, les machines de bureau et les serveurs. Et c’est en réponse à cette mise à l’échelle requise qui, littéralement, une architecture modulaire a été conçue.
Voici le bulldozer vu d’un aperçu de haut niveau. Un coup d’œil rapide montre qu’il y a quatre cœurs d’exécution entourés de beaucoup de cache – 16 Mo, en fait. Avec la mémoire DDR3 à double canal interfaçante avec le cache Northbridge sur puce, le cache L3 et quatre liens hypertransport au reste du système, il ne semble pas y avoir beaucoup de nouveau ici. Il n’échappera pas à votre attention qui, dans aucune partie de l’image, n’est référence aux graphiques intégrés: Bulldozer est un CPU pur.
Mais les premiers regards peuvent être trompeurs. Vous voyez, bien qu’il n’y ait aucune disposition pour les graphiques intégrés, il y a huit cœurs de CPU présents ici, mais chaque noyau ne correspond pas tout à fait dans le moule entièrement indépendant établi par les processeurs. Il y a des explications en cours, alors zoomons sur un quart de la puce.
Voici un aperçu simple de ce qui se passe dans un seul module. Il est important de comprendre que Bulldozer est construit à travers des modules, où une puce à huit cœurs a quatre modules, une puce à six cœurs a trois modules actifs et un cré. Le mettant en perspective, une puce à huit modes à quatre modules pèse avec près de deux milliards de transistors (ahem, 1.2BN, après que AMD ait reconnu l’erreur de comptage) et a une taille de matrice dans la région de 315 mm². Fait intéressant, c’est de la même taille qu’un piline de six cœurs II, mais il est fabriqué sur le plus grand processus de 45 nm. Intel, cependant, parvient à emballer quatre cœurs, huit threads et graphiques intégrés (Core i7 2600K) dans un dé.
AMD n’a pas deux cœurs entièrement indépendants par module, mais il n’est pas non plus intégré que, disons, les noyaux hyper-lancinants trouvés sur les dernières puces d’Intel, où les ressources sont bel et bien partagées entre les processeurs. La raison de ce méli-mélo de base repose sur l’équilibre entre la taille de la matrice – et, par conséquent, le coût de fabrication – contre le débit de base. Dans un monde qui se souciait peu du coût économique, AMD concevrait un bulldozer avec huit cœurs indépendants, ainsi que tous les silicium par cœur nécessaire qui implique.
Prendre un bulldozer pour ce qu’il est, supposons que deux threads se déplacent dans ce module, à traiter sur chaque noyau. Ils doivent partager l’étape de configuration – récupérer, décoder – ainsi que le planificateur à virgule flottante (beaucoup plus grand), et, travailler un point qui est important à comprendre, cela ne se produirait pas sur des noyaux vraiment séparés. Cependant, l’étape du décodage a été augmentée à quatre instructions par cycle d’horloge, contre trois sur le phénomène II (quoique par noyau), et, grâce à une technique appelée Branch Fusion, le bulldozer peut réellement rendre le stade de décodage plus large.
En descendant, chaque noyau peut gérer deux ALUS et deux AGUS, bien que nous nous rappelions que PHENOM II en a trois chacun, et vous nous verrez en parler davantage lors des performances de référence à thread à un seul thread. De retour sur la bonne voie, chaque noyau n’a que 16 Ko de cache L1, et bien que nous nous attendions à plus, AMD dit que le cache L2 significatif aide, où chaque module a un 2 Mo exclusif à sa disposition.
Revenant au planificateur FP, cette ressource partagée a un système de bouclage pour permettre aux noyaux séparés de savoir que le travail a été terminé. Et ce travail se fait par quatre tuyaux – deux FMAC 128 bits et deux entiers 128 bits – tout comme le phénomène II.
Considérés isolément, les choix de conception d’AMD nous donnent une idée assez claire de l’idéologie derrière Bulldozer. Les performances à thread unique, où un thread a le module entier pour lui-même, est généralement sans importance ici, mis en évidence par la configuration réduite de l’ALU et de l’AGU, et le phénomène II peut bien lui donner un bon pas dans de telles circonstances, en particulier lorsqu’elles sont jugées contre les applications qui utilisent un ancien (er) code. Augmentez la charge en remplissant le module avec deux threads et le partage inévitable des ressources a lieu, en particulier dans le haut de gamme, mais les dégradations de performances sont améliorées en ayant un décodeur de quatre larges.
Il est difficile de savoir à quel point les modules de bulldozer sont puissants sans connaissance préalable du type de charge de travail. S’il utilise du code optimisé non-Bulldozer, il y a une possibilité réelle que les chiffres seront plus faibles de complications, AMD introduit un pipeline plus long avant que les threads puissent être entièrement calculés. Le processeur 101 nous dit que le fait d’avoir un tel pipeline ouvre la possibilité de stands coûteux et de mauvaise prédiction des succursales, si les choses devraient mal tourner. Adam Kozak d’AMD nous a informés que le bulldozer a une logique et une prédiction indépendantes (bien améliorées (divorcées).
Tout enroulant à partir d’un point de vue d’architecture de base, le cache L3 contrôlé par Northbridge est partagé entre les cœurs. Cela totalise 8 Mo, indépendamment du nombre de modules implémentés, ce qui signifie que les puces avec moins de cœurs reçoivent excessivement plus de cache.
Le Northbridge contrôle également les accès à partir de la mémoire du système. Suivre la tradition et opter pour une configuration DDR3 à double canal, ostensiblement parce qu’il y a tellement de cache sur puce disponible, AMD augmente les vitesses à une vitesse officielle de 18666 MHz
Bulldozer est arrivé: AMD FX-8150 Examen du processeur
La grande révolution dont AMD parle depuis si longtemps s’est finalement produite! Aujourd’hui, nous avons réussi à rencontrer un processeur de bureau à huit cœurs basé sur la microarchitecture de bulldozer attendue depuis longtemps. Découvrez notre examen si AMD a réussi à retrouver la direction perdue depuis longtemps cette fois.
Sans doute que les nouveaux processeurs AMD basés sur la microarchitecture de bulldozer sont l’un des produits les plus attendus non seulement de l’année, mais au moins des cinq derniers. Il y a plusieurs raisons à cela ainsi que pour le fait que les produits AMD ont tellement de fans. Je suis sûr que certains d’entre vous se souviennent des moments où les processeurs AMD étaient meilleurs que ceux Intel dans tous les aspects. Certains utilisateurs aiment les produits AMD pour la combinaison équilibrée de prix et de performances qu’ils ont à offrir. Et certains ont peut-être été emportés par la passion, avec laquelle ils ont parlé des avantages de la nouvelle microarchitecture sur laquelle ils ont travaillé. Tout cela combiné avec les années d’attente de la nouvelle génération de processeurs de bulldozer a produit un résultat assez logique: vous lisez cette critique avec un grand intérêt et une excitation.
Cependant, l’attente en valait vraiment la peine. Le succès de la microarchitecture du processeur de bulldozer déterminera la situation sur le marché des processeurs au cours des prochaines années. À l’heure actuelle, seule Intel possède des ressources d’ingénierie suffisantes et des capacités de production pour déployer de nouvelles microarchitectures tous les deux à trois ans. Quant à AMD, ils doivent s’en tenir à un tempo beaucoup plus raisonnable. Il peut vous sembler un peu effrayant, mais la microarchitecture actuellement utilisée dans les processeurs PHENOM II et Athlon II remonte à 2003. Il n’y a eu que mineur “cosmétique” modifications apportées depuis lors. Par conséquent, nous ne nous attendons pas vraiment à ce que le lancement de processeurs de bulldozer accélère le processus de développement d’AMD. Sans doute que le nouveau bulldozer sera la base de tous les produits AMD haute performance pour les prochaines années.
La version actuelle de la feuille de route de l’entreprise exploite cette microarchitecture jusqu’en 2014, mais elle continuera probablement son existence au-delà de ce point.
DMLA’s Promection de livrer au moins 10 à 15% de renforcement des performances chaque année est plus une source de préoccupation plutôt que d’optimisme. L’augmentation de la fréquence d’horloge sera très probablement le principal moyen de renforcer les performances, les améliorations microarchitecturales étant plus en arrière-plan.
En d’autres termes, le succès de la microarchitecture de bulldozer aujourd’hui aura un effet qui change la vie sur l’AMD’S Future, déterminera à quel point leurs produits seront compétitifs et, en fin de compte, ce qui arrivera sur le marché des processeurs en général.
Bien sûr on peut’t nier que le bulldozer n’est pas le seul produit clé pour AMD. Cette microarchitecture est actuellement positionnée pour les systèmes de bureau et de serveur haute performance. Dans le même temps, AMD a d’autres produits pour le reste du marché. Par exemple, les processeurs énergétiques à faible coût sur la microarchitecture Bobcat lancés plus tôt cette année ou Llano APUS sont tout aussi importants pour l’entreprise. Et nos tests ont montré qu’il s’agissait de produits assez réussis qui peuvent devenir une excellente plate-forme pour les netbooks et les nettops ainsi que pour alimenter les plates-formes intégrées grand public.
Néanmoins, bulldozer’Le succès ou l’échec aura une importance beaucoup plus importante à long terme. Premièrement, cette microarchitecture cible les segments de marché avec une marge bénéficiaire beaucoup plus élevée – serveurs et ordinateurs de bureau haute performance. Par conséquent, cela peut avoir un grand impact sur AMD’s situation financière. Deuxièmement, les ingénieurs impliqués dans la conception et le développement de la nouvelle microarchitecture n’ont en fait rien à voir avec le succès d’AMD’S C, E et une série Processeurs. Ces processeurs (ou APU dans AMD’Les termes de S) doivent leur succès sur le marché aux noyaux graphiques Radeon HD intégrés qui sont entrés dans les processeurs AMD contemporains en raison d’une acquisition en temps opportun de ATI Technologies. Quant à Bulldozer, il s’agit davantage d’un test de qualification pour l’équipe d’ingénierie travaillant spécifiquement sur la microarchitecture des cœurs de calcul. Et troisièmement, Bulldozer deviendra éventuellement la base de l’ensemble de la gamme de processeurs AMD à l’exception des produits conçus pour. Ainsi, un jour, cette microarchitecture arrivera également aux segments de marché bas de gamme en remplacement complètement de K10 partout, même dans les processeurs Llano.
Dans l’ensemble, il est difficile de surestimer l’importance d’un lancement réussi de la microarchitecture au bulldozer. C’est un produit marqué au niveau psychologique et pratique, c’est pourquoi nous espérons vraiment voir quelque chose comme un nouveau K7 ou K8.
Mais avant même de passer aux tests de performance réels, nous pouvons indiquer qu’il y a très peu de chances de répéter le phénomène mentionné ci-dessus. La dernière fois qu’Intel a aidé AMD à gagner le leadership en essayant de promouvoir activement une microarchitecture Netburst pas très idéale. À l’époque, les ingénieurs Intel parient sur la croissance des fréquences d’horloge, qui trébuchaient finalement sur des courants de fuite gigantesques, tandis qu’AMD offrait une microarchitecture mieux équilibrée visant à traiter plus d’instructions par cycle d’horloge. Mais lorsque Intel a révisé sa stratégie et a lancé la nouvelle microarchitecture de base, qui essayait également de traiter autant d’instructions par horloge que possible, AMD a dû se remettre à une deuxième place où il a été depuis lors.
Il est évidemment très difficile de surpasser les processeurs Intel contemporains dans le nombre d’instructions traitées par cycle d’horloge. Aujourd’hui’S Microarchitecture Sandy Bridge est le résultat d’au moins trois tours d’optimisations appliquées à la conception, qui était efficace dès le départ. Par conséquent, nous pouvons’t s’attendre à ce que les noyaux de calcul d’AMD offrent une efficacité relative encore plus élevée. Surtout, puisque les ingénieurs AMD ne l’ont fait’T a même un but comme ça.
Bulldozer a une cible principale différente. Selon les développeurs, les processeurs basés sur cette microarchitecture doivent fonctionner rapidement en raison des fréquences d’horloge élevées et du plus grand nombre de cœurs de calcul par rapport aux prédécesseurs et aux concurrents. En même temps, ils devraient rester assez rentables, je.e. avoir une petite matrice de semi-conducteurs et une dissipation de chaleur par cœur relativement faible.
Secrets of AMD’s conception multi-core
Il est assez logique que l’augmentation du nombre de noyaux de processeur entraîne inévitablement une augmentation de la taille du processeur. En conséquence, la complexité du processus de fabrication ainsi que les coûts de production augmentent également. Par conséquent, les processeurs avec le plus grand nombre de cœurs, par exemple, ne sont actuellement utilisés que dans le segment des serveurs, car les clients des entreprises sont beaucoup plus désireux de payer un supplément que les utilisateurs réguliers. DMLA’La stratégie pour augmenter le nombre de cœurs de processeur tout en maintenant leur prix acceptable implique qu’ils devront simplifier les noyaux en conséquence. Cependant, en revanche, la simplification des noyaux peut produire des conséquences indésirables, telles que l’abaissement des performances du système dans des applications qui ne peuvent pas bien parallèles, qui sont actuellement encore assez nombreuses.
Par conséquent, les ingénieurs AMD ont décidé de prendre un moyen alternatif unique. La microarchitecture des noyaux individuels est devenue plus complexe augmentant le nombre d’instructions exécutées par cycle d’horloge unique si possible.
Mais certaines parties des ressources, qui existent normalement dans chaque noyau de processeur mais qui ont une efficacité excessive, sont maintenant partagées entre des paires de cœurs.
Les unités dual-core résultant sont devenues les principaux éléments constitutifs des processeurs de bulldozer. AMD fait référence à ces unités en tant que modules. Chacun d’eux a deux ensembles entièrement fonctionnels d’unités d’exécution entier. Cependant, l’unité de point flottante, les unités de pré-écaille de données et les décodeurs d’instructions ainsi que le cache L2 sont partagés entre les deux cœurs. Selon les développeurs, ces composants ont un potentiel suffisant pour nourrir les deux noyaux, car dans ces cas où il y a un de ces ensembles par noyau, il est souvent au ralenti. De plus, les retards de leur opération sans stand n’ont pas d’effet sérieux sur la performance globale qui en résulte.
Selon AMD, un seul module conçu comme décrit ci-dessus peut fonctionner à la capacité de 80% d’un processeur double cœur entièrement fonctionnel. Cependant, ils économisent environ 44% du budget du transistor (et par conséquent de la taille de la matrice semi-conducteurs).
Cette approche inventive pour augmenter la densité des noyaux du processeur AMD a permis à l’entreprise de concevoir une déroge.
De plus, une partie assez importante de la matrice est allouée à la mémoire du cache. Les caches de processeur L2 partagées entre les paires de noyaux de CPU dans un seul module sont de 2 Mo chacun, et la mémoire de cache L3 partagée sur l’ensemble du processeur est de 8 Mo. De cette façon, si nous prenons en compte AMD’s Conception de cache exclusive traditionnelle, nous pouvons indiquer que la quantité totale de mémoire de cache atteint 16 Mo par CPU à huit cœurs. Dans le même temps, la taille de la dépérisation du bulldozer reste dans des limites raisonnables, ce qui signifie que les développeurs AMD ont en effet atteint leur objectif ultime.
Si nous parlons de nombres absolus, cela signifie que les processeurs de bulldozer à huit cœurs auront un dépérissement semi-conducteur plus petit que, disons, des processeurs de Thuban (Phenoom II X6) à six cœurs avec la microarchitecture K10 à l’intérieur. Cependant, il est important de garder à l’esprit que le processeur de bulldozer sera fabriqué en utilisant un processus de production plus avancé de 32 nm. Et par rapport aux processeurs contemporains de ponts Intel Sandy quad-core contemporains, les nouveaux processeurs AMD à huit cœurs n’auront que 45% plus grand.
Cependant, en raison de la technologie d’hyper-threading, le système d’exploitation peut également voir des processeurs quadricages Intel Sandy Bridge comme des processeurs à huit cœurs, tout comme le bulldozer. Ce fait peut poser une question sur la façon dont il est approprié d’appeler réellement Bulldozer un processeur à huit cœurs à part entière. Cependant, il est important de comprendre qu’AMD et Intel ont adopté différentes approches pour mettre en œuvre une exécution simultanée de huit threads de calcul. Les développeurs Intel ont armé leur microarchitecture avec la possibilité d’exécuter deux threads de calcul dans un seul noyau en utilisant un seul ensemble d’unités d’exécution. AMD, au contraire, a supprimé tout “inutile” Extras à partir de deux noyaux entièrement fonctionnels, mais a conservé deux ensembles d’unités d’exécution à l’intérieur de chaque module.
En conséquence, Intel’S La technologie de lancement d’hyper’La solution S a produit une augmentation de 80% en transition de 4 à 8 threads.
Bien que je dois admettre que le semi-conducteur meurt du processeur de bulldozer à huit cœurs ressemble plus à un caisson à quatre cœurs en raison de sa structure interne modulaire.
Plus d’instructions par horloge?
De toute évidence, augmenter le nombre de noyaux ne sera pas une panacée ultime. Il est devenu clair lorsque AMD a lancé ses processeurs PHENOM II X6, qui étaient inférieurs au pont de sable quad-core en performance. Par conséquent, les développeurs AMD n’ont pas’t s’arrêter à des modifications de conception étendues. La microarchitecture de base au bulldozer a été modifiée pratiquement complètement comparée à K10, il y a donc de l’espoir que les systèmes AMD accélèrent non seulement dans les tâches multi-thread, mais aussi dans des applications moins parallèles. Et ces espoirs sont sauvegardés par des preuves très objectives. Alors que les microarchitectures AMD précédentes ont été conçues pour traiter jusqu’à trois instructions par horloge (sur un seul noyau), la microarchitecture de bulldozer devrait être capable de traiter quatre instructions par horloge, ce qui le rapproche très près du processeur concurrent sur la microarchitecture centrale.
Nous pouvons voir des changements de qualité aux premières étapes du pipeline d’exécution: pendant les instructions préfectilées et décodage. Ces étapes sont partagées entre les paires de noyaux dans un seul module, donc AMD s’est assuré qu’ils ne l’ont fait’t se transformer en un goulot d’étranglement architectural. Les instructions à décoder sont prédéfinies à partir du cache L1i dans des blocs de 32 octets – deux fois plus que dans les processeurs de base de deuxième génération. Le cache l1i réel pour les instructions est de 64 ko et a une association à double sens. Les instructions à décoder sont préchargées spéculativement dans ce cache de la mémoire du cache L2.
Les instructions sont préfectées par l’unité de prédiction de la branche contenant deux ensembles de tampons, qui surveillent indépendamment l’activité de différents cœurs. De cette façon le bulldozer’t “Aller se faire cuire un œuf” dans les fils pendant la prédiction des branches. Étant donné que la nouvelle microarchitecture est conçue pour fonctionner à une fréquence d’horloge élevée, la qualité des prévisions de branche est extrêmement importante. Par conséquent, AMD a complètement changé les algorithmes de prédiction des succursales et maintenant ils espèrent que la précision de la prédiction des succursales dans le nouveau bulldozer s’améliorera considérablement.
Bulldozer’Le décodeur d’instructions S x86 est également partagé entre les deux cœurs et est capable de décoder jusqu’à quatre instructions entrantes par cycle d’horloge. Cependant, ses performances sont limitées par quatre macro-instructions (qui sont le résultat du processus de décodage, dans AMD’S termes), tandis que les instructions x86 peuvent se désintégrer en 1-2 ou même plus de macro-instructions. Ainsi, même si le décodeur est devenu 33% plus efficace par rapport à la microarchitecture de génération précédente, ses performances peuvent ne pas être suffisamment élevées pour charger de manière optimale deux grappes entières et un cluster à virgule flottante.
Je dois dire qu’ils ont également utilisé une sorte de technologie de macro-fusion dans le nouveau bulldozer. Certains groupes d’instructions x86 peuvent se réunir et passer par le décodeur en une seule instruction – AMD l’appelle Fusion Branch Fusion.
Les macro-instructions décodées sont ensuite distribuées à trois clusters de calcul, dont deux sont le reste des noyaux de calcul à part entière et un autre, l’amas à virgule flottante, est partagé par les noyaux. Chacun de ces clusters a ses propres instructions pour réorganiser les logiques et son propre planificateur. Cela signifie évidemment que AMD peut éventuellement remplacer ou modifier entièrement certains de ces clusters dans leurs futurs produits.
Instructions Le processus de réorganisation dans chaque cluster est basé sur un fichier de registre physique. Ce fichier stocke les liens pour enregistrer le contenu et élimine la nécessité de déplacer constamment des données à l’intérieur du processeur une fois que les instructions modifient les modifications. Cette approche a remplacé le tampon de réorganisation, car un fichier de registre physique est plus économe en énergie et plus tolérant à l’augmentation de la fréquence de l’horloge du processeur.
Les clusters entiers contiennent chacun deux unités d’exécution arithmétique (ALU) et deux unités pour travailler avec des adresses mémoire (AGU). Contrairement à la microarchitecture K10, il y a un Alu et un Agu de moins, mais selon AMD, il ne devrait pas’t affecter gravement les performances, tout en permettant de réduire considérablement la taille de la matrice. Je peux facilement croire que: ce n’est pas’Il est très logique d’avoir plus de deux ALU et deux AGU par cluster entier, car le décodeur ne peut pas envoyer plus de quatre macro-instructions par horloge pour l’exécution par les deux clusters.
Dans le même temps, les unités d’exécution sont devenues plus universelles et diffèrent à peine en fonctionnalité.
L’organisation du système de mémoire cache a radicalement changé. Ils ont abaissé la taille du cache L1D de 64 Ko à 16 Ko et l’ont rendu inclusif avec l’écriture. En même temps, ils ont augmenté son association à 4 voies et ajouté un “Préditeur de la manière”. Afin de compenser la grave réduction de la taille, ils ont augmenté considérablement la bande passante du cache de données L1, de sorte qu’il peut maintenant traiter jusqu’à trois opérations 128 bits en même temps – deux lectures et une écriture.
Les changements dans la bande passante de cache L1D sont évidemment liés à la nécessité d’implémenter les instructions AVX 256 bits, qui sont désormais prises en charge dans l’unité FPU partagée. Cependant, ce n’est pas’T signifie que les unités à virgule flottante sont devenues de 256 bits. En réalité, il y a quatre unités de 128 bits dans un seul module de bulldozer et AVX les instructions sont décodées comme des paires connectées d’opérations 128 bits. Par conséquent, les blocs de multiplication à virgule flottante (FMAC) s’unissent pour les exécuter et les performances du cluster à virgule flottante tombent à un module AVX-instruction par processeur par cycle d’horloge.
FPU ne fait pas’T a son propre cache L1, c’est pourquoi ce cluster fonctionne avec des données via des unités entières.
Depuis que les ingénieurs AMD ont décidé de mettre en œuvre Intel’S AVX-Istructions Support dans leurs processeurs de bulldozer, ils ont également ajouté un support pour d’autres ensembles d’instructions actuels, tels que SSE4.2 et Aesni pour l’accélération du chiffrement. De plus, AMD a également introduit quelques instructions à part: la multiplication et l’ajout à triple opère (FMA4) et leur propre vision unique du futur développement AVX – XOP.
Bulldozer’Le cache S L2 existe en une seule unité à l’intérieur du module de processeur et est partagé par les cœurs. Il est d’une taille impressionnante de 2 Mo et a une association à 16 voies. Cependant, la latence d’un cache comme celle est passée à 18-20 horloges, tandis que la largeur du bus est restée la même qu’avant – 128 bits. Cela signifie que même si Bulldozer’Le cache S L2 est grand, il n’est pas particulièrement rapide: les concurrents actuels et les prédécesseurs ont des caches L2 avec environ la moitié de la latence. Je dois dire qu’avec un petit cache L1D avec une latence à 4 bloc (qui est également plus élevé que dans la microarchitecture K10), ce n’est pas’T a l’air trop bien. Cependant, AMD insiste sur le fait qu’ils ont augmenté la latence de leur mémoire de cache uniquement pour s’assurer que le bulldozer serait capable de fonctionner à des vitesses d’horloge plus élevées.
De plus, les ingénieurs AMD ont mis en œuvre une unité de prélecture de données efficace capable de charger des données spéculatives dans les caches L1 et L2. Ces unités sont censées travailler beaucoup plus efficacement maintenant et devraient être capables de reconnaître les structures de données irrégulières.
Théoriquement, Bulldozer a l’air très attrayant. AMD a complètement révisé leur ancienne vision de la microarchitecture du processeur et a trouvé un design totalement nouveau. Et je dois dire que ce nouveau design semble très prometteur, car la nouvelle microarchitecture a été optimisée pour traiter quatre instructions par horloge au lieu de trois dans un noyau de processeur. En outre, il prend également en charge la macro-fusion des instructions avant le stade de décodage, ce qui augmente encore plus les performances efficaces.
Mais tout semble parfait en image uniquement lorsque nous regardons un noyau et ne prenons pas en considération le fait qu’en réalité, de tels noyaux sont combinés en paires. Et le module de bulldozer double cœur a trop d’unités partagées entre les noyaux. En particulier, comme un module comme celui-ci n’a qu’une seule unité d’instructions et un décodeur, l’ensemble du bloc à deux nages ne peut toujours traiter que quatre instructions par horloge. Et cela signifie qu’en termes de performances théoriques, c’est un module de bulldozer, mais pas le noyau réel qui serait considéré comme un équivalent logique à un seul noyau dans Sandy Bridge Processeurs. Dans ce cas, le module’La capacité S à effectuer deux threads ressemble à une réponse assez logique d’AMD à Intel’S Technologie Hyper-Threading.
Bien sûr, nos tests de performance des nouveaux processeurs mettront tout ce que je’s, mais même à ce stade, nous pouvons’t Aide à penser ce bulldozer’Le positionnement de S en tant que processeur à huit cœurs est plus une décision de marketing. En réalité, c’est le nombre de modules qui nous donnent une meilleure idée de ces processeurs’ potentiel de calcul. En ce qui concerne les performances théoriques, il semble plus logique de comparer ces modules aux noyaux en termes de microarchitecture Intel Core de deuxième génération.
Par conséquent, une question logique apparaît: pourquoi AMD a-t-elle décidé d’implémenter un traitement à deux thread dans un seul module de processeur? Pourquoi pourrait-il’Ils combinent simplement les unités d’exécution dans deux cœurs différents en un seul cluster? Il y a plusieurs raisons à cela.
Premièrement, ils ont besoin de logiques inter-processeurs avancées pour pouvoir charger de nombreuses unités d’exécution de manière optimale. AMD, cependant, n’a pas fait’T a réussi à mettre en œuvre une prédiction et une instruction de branche hautement efficaces. Par conséquent, il est de la responsabilité des développeurs de logiciels de livrer des applications compatibles au bulldozer prenant en charge le multi-threading, qui sont bien dégradées et utilisent les unités d’exécution de manière optimale.
Deuxièmement, un plus grand nombre de threads de calcul traités simultanément est une bonne chose. Alors que les utilisateurs de bureau et en particulier les joueurs ne bénéficieront guère à cela de huit cœurs de bulldozer assez simples, cette microarchitecture devrait être très bienvenue dans l’environnement du serveur. Il est donc tout à fait possible que l’objectif principal du bulldozer retrouve AMD’S leadership sur le marché des serveurs plutôt que de rendre les amateurs informatiques heureux.
Turbo Core pour obtenir encore plus de turbo
L’efficacité énergétique est l’une des caractéristiques les plus importantes des processeurs contemporains. Intel, par exemple, met l’objectif de réduire la consommation d’énergie de leurs microarchitectures à venir au sommet de la liste. AMD a Hasn’T encore est arrivé, et leurs ingénieurs chassent encore principalement des vitesses plus élevées. Mais ce n’est pas’t signifier que les développeurs n’ont pas’T Portez l’attention due au bulldozer’S Caractéristiques thermiques et de puissance. Au contraire, après Llano, les principales approches de l’efficacité énergétique ont trouvé leur chemin dans les processeurs de bulldozer. Cependant, dans ce cas, les développeurs ont utilisé le potentiel libéré non pas beaucoup pour les économies d’énergie, mais plutôt pour augmenter les fréquences de l’horloge et ainsi améliorer encore plus les performances.
Bien sûr, le processus de production le plus fin a eu un effet positif sur la consommation d’énergie et les lectures de dissipation de chaleur. Bulldozer est fabriqué avec un processus diélectrique de 32 nm à haute teneur en K, des transistors à portail métallique et une technologie SOI. En d’autres termes, c’est le même processus mondial des Foundries qui est utilisé pour la fabrication de Llano. En conséquence, les processeurs de bulldozer à huit cœurs de production maintiennent 1.4 V Tension de noyau maximale.
Cependant, l’innovation majeure héritée de Llano est l’utilisation du déclenchement de puissance, qui devrait déconnecter la puissance des parties sélectionnées du CPU. Ils permettent d’arrêter l’énergie sur des modules doubles et de la mémoire de cache sélectionnés dans les processeurs de bulldozer.
Lorsque les deux cœurs de calcul dans un module passent en mode d’économie d’alimentation C6, l’alimentation du module s’éteint. Malheureusement, cette technologie ne peut pas s’appliquer aux noyaux de processeur, car il n’y a tout simplement pas de cœurs individuels à l’intérieur du bulldozer – ils partagent certaines de leurs ressources avec les autres cœurs dans les mêmes modules.
Les modes d’économie d’énergie C6 contrôlent également la technologie Turbo Core dans les processeurs de bulldozer. Quand au moins la moitié des modules de processeur de bulldozer sont éteints et en mode économie d’énergie, sa tension centrale et ses fréquences d’horloge augmentent. Ce mode forcé est appelé max turbo boost.
Cependant, il n’y a rien de nouveau en mode Max Turbo Boost, car AMD a introduit le même overclocking automatique dans leurs processeurs Thuban sur la microarchitecture K10. La chose principalement nouvelle ici est le mode All Core Boost, lorsque la fréquence d’horloge peut augmenter au-delà de sa valeur nominale même lorsque tous les cœurs de processeur sont actifs. La version améliorée de Turbo Core implémentée dans les processeurs de bulldozer leur permet d’évaluer avec précision leur consommation d’énergie réelle et leur dissipation de chaleur à en juger par le niveau d’utilisation des différentes unités. Donc, si selon le processeur’S estimation que la consommation électrique actuelle et la dissipation de chaleur sont bien en dessous des valeurs de seuil, le processeur peut augmenter sa tension centrale et sa vitesse d’horloge même si aucun des noyaux n’est en mode inactif.
Ainsi, la fréquence d’horloge des processeurs à base de bulldozer est une valeur extrêmement variable. Il peut changer considérablement dans un très grand intervalle (jusqu’à 900 MHz) selon le “lourdeur” des algorithmes exécutés et sur le nombre de noyaux actifs.
Rafraîchissement de la plate-forme de bureau
Avec le lancement de la nouvelle microarchitecture AMD a non seulement gardé la conception de la nouvelle plate-forme, mais a même maintenu la compatibilité des nouveaux processeurs de bulldozer avec l’infrastructure existante. En conséquence, tout comme leurs prédécesseurs, les nouveaux processeurs contiennent un pont nord intégré avec le cache L3, le contrôleur de mémoire et le contrôleur de bus hyper-transport. Dans le même temps, bien que tous les processeurs AMD et Intel récemment lancés aient également un contrôleur de bus graphique PCI Express intégré, le nouveau bulldozer ne fait pas’t l’avoir.
Tout comme les processeurs basés sur la microarchitecture K10, le North Bridge dans Bulldozer Processeurs fonctionne à sa propre fréquence d’horloge, qui est fixé à 2.0-2.2 GHz pour différents modèles CPU. Notez que cette fréquence a un effet sur les performances, car elle affecte directement la vitesse du cache L3. Et comme nous l’avons déjà dit, les nouveaux processeurs ont un cache L3 de 8 Mo avec une association à 64 voies. Par demande spéciale des utilisateurs de l’entreprise, les données stockées dans cette mémoire de cache sont protégées par le code de correction d’erreur (ECC).
Le contrôleur de mémoire des processeurs de bulldozer ne fait pas’t se vante quelque chose de principalement nouveau. Tout comme avant, il prend en charge DDR3 SDRAM, utilise la conception à double canal et se compose en fait de deux contrôleurs indépendants à un seul canal qui peuvent fonctionner comme une paire ou indépendante. La seule chose qu’AMD a ajoutée ici est la prise en charge de types de mémoire plus rapides, tels que le DDR3-1867, et la compatibilité avec les modules de mémoire économes en énergie fonctionnant à 1.25 V et 1.35 V.
En parlant de la modification du bulldozer de bureau, nommé Zambezi, nous devons mentionner qu’il est conçu pour la nouvelle plate-forme Socket AM3 + également connue sous le nom de Scorpius. Socket AM3 + a 942 broches, qui est 1 broche de plus que la prise AM3. Cependant, malgré la différence de broche, le nouveau Zambezi sera compatible avec l’ancien socket AM3 Mainboards aussi. Si vous utilisez un nouveau processeur avec l’ancienne carte principale, vous ne perdrez que certaines fonctions de gestion de l’alimentation sélectionnées. Par exemple, les fréquences changent plus lentement avec un turbo-noyau actif et refroidis’n’Quiet et Vdrop ne fonctionnera pas du tout.
Néanmoins, AMD a travaillé en étroite collaboration avec tous les fabricants de panneaux routiers pour s’assurer qu’au moment où Zambezi lancera, il y aura de nombreux nouveaux produits disponibles sur la base des nouveaux chipsets de la série 900. Le débit ci-dessous montre un système typique construit autour du processeur Zambezi et le nouveau chipset:
La caractéristique distinctive de la nouvelle AMD 990FX (et ses modifications plus simples – AMD 990X et AMD 970) est essentiellement le soutien de particularités électriques spécifiques du nouveau socket AM3+. Il n’y a pas de nouvelles interfaces d’aucune sorte. Tout comme les chipsets de la série 800, le nouveau pont sud prend en charge six ports de 6 Gbps et quatorze USB 2.0 ports. Même si nous mourons d’envie de voir des choses comme PCI Express 3.0 ou au moins USB 3.0 Soutien dans les nouveaux chipsets, il n’y a rien de tel. C’est en fait assez étrange parce que les chipsets pour la plate-forme FM1 à socket bas de gamme ont acquis USB 3.0 Support.
Les seules différences entre les nouvelles modifications du chipset sont les types de configurations multi-GPU prises en charge:
Gamme de processeurs zambezi
Le lancement des processeurs Zambezi complète AMD’Mise à jour du processeur S. Les processeurs de bureau basés sur la nouvelle microarchitecture de bulldozer seront le nouveau produit phare, qui s’élèvera rapidement du marché tous les modèles PHENOM II.
Afin de souligner la nature innovante de leur nouvelle microarchitecture, AMD utilisera un nom marketing de différence pour leurs processeurs Zambezi – FX. D’une part, il s’inscrit parfaitement dans le nouveau système de dénomination qui implique l’utilisation de lettres pour le marquage du processeur, mais d’autre part, il rappelle les processeurs légendaires Athlon 64 FX, qui étaient les CPU de bureau les plus rapides il y a 6 à 7 ans. Cependant, ces temps sont partis depuis longtemps, alors laissez’s examinez de plus près ce que nous nous proposons aujourd’hui.
Il y aura très bientôt quatre modèles de processeurs FX disponibles sur le marché: bien que les modèles de processeurs Zambezi diffèrent non seulement par les vitesses d’horloge, mais aussi par le nombre de noyaux de calcul actifs, ils seront tous construits à partir de la même matrice semi-conductrice unifiée. C’est ici:
Afin de construire des processeurs avec moins de noyaux de huit, AMD en désactivera certains sur le dé semi-conducteur. C’est toujours une question, s’ils peuvent être déverrouillés de la même manière que nous avons fait avec des processeurs sur la microarchitecture K10. Néanmoins, nous avons vu toutes les options correspondantes dans la configuration du BIOS de plusieurs panneaux principaux construits autour des nouveaux chipsets de la série 900, donc il y a certainement de l’espoir pour le résultat positif.
La production de processeurs à six cœurs et quad-core impliquera le verrouillage du noyau par module. Cela signifie qu’ils verrouilleront l’intégralité du module double cœur plutôt qu’un deuxième noyau dans deux modules comme celui-ci, bien que cette dernière approche puisse être beaucoup plus efficace du point de vue des performances. Cependant, les processeurs de bulldozer à six et quad-core ne sont que la façon d’utiliser les matrices défectueuses, qui peuvent être assez nombreuses car elles vont utiliser le nouveau processus de production et la matrice est assez grande en taille.
Bien qu’AMD ait optimisé la nouvelle microarchitecture pour le fonctionnement à des vitesses d’horloge élevées, nous pouvons’t dis qu’ils ont atteint toute percée impressionnante. Le seuil de 4 GHz n’est toujours pas sincère et la fréquence nominale du processeur FX supérieur est encore inférieure à celle du phénomène II x4 980. Nous espérons que lorsqu’ils maîtrisent le processus de production, les fréquences de Zambezi continueront de croître rapidement. Bien que selon la feuille de route AMD actuelle, la nouvelle famille de processeurs devrait commencer à accélérer au plus tôt le premier trimestre 2012.
Nous donnions’t Voir toutes les victoires dramatiques en termes de consommation d’énergie et de dissipation de la chaleur. AMD nous promet depuis longtemps que le nouveau bulldozer serait plus économe en énergie que les prédécesseurs, mais en réalité, les huit meilleurs modèles ont le même TDP que les processeurs supérieurs II PHENOM II. Bien que très bientôt, ils devraient ajouter un modèle FX-8120 de 95 W ainsi qu’un FX-8100 avec le même TDP à leur gamme.
D’un autre côté, les prix des nouveaux processeurs FX semblent être plus qu’attractifs. AMD ne fait pas’Je veux s’écarter de leur plan pour continuer à offrir des plates-formes à un prix inférieur à la concurrence, c’est pourquoi les huit meilleurs processeurs Zambezi sont positionnés contre les CPU supérieurs de Core i5. Dans l’ensemble, AMD va s’en tenir au plan de positionnement suivant:
En d’autres termes, AMD n’a aucune intention de concurrencer les processeurs Intel à six cœurs et le prochain LGA2011 et a l’intention de se concentrer sur le segment grand public.
Une excellente nouvelle pour les amateurs est que tous les processeurs FX viendront avec des multiplicateurs déverrouillés. Tous les processeurs Zambezi peuvent facilement être overclockés non seulement en ajustant simplement le multiplicateur d’horloge de base, mais aussi en reconfigurant leur technologie Turbo Core. Vous pouvez également overclocker le sous-système de mémoire et la fréquence du pont nord intégré au processeur.
Regarder de plus près AMD FX-8150
AMD nous a donné l’occasion de consulter le nouveau processeur Zambezi – FX-8150.
Sa vitesse d’horloge nominale est de 3.6 GHz et vous pouvez en savoir plus à ce sujet à partir de la capture d’écran CPU-Z suivante:
Notez qu’il utilise un pas de processeur B2 et qu’il n’est pas de loin la première version déjà. Les modifications précédentes du semi-conducteur mouent’t en faisant parce qu’ils ont refusé de travailler aux vitesses d’horloge initialement planifiées. C’est pourquoi le lancement du printemps a été légèrement repoussé à l’été puis à tomber et a finalement eu lieu à la mi-octobre.
Cependant, le Today’S fréquence de 3.6 GHz ne fait pas’T a l’air très impressionnant. AMD et Intel, ont tous deux des produits fonctionnant à des fréquences plus élevées. Cependant, FX-8150 prend en charge la technologie Turbo Core très prometteuse, qui est capable d’augmenter automatiquement la fréquence d’horloge CPU à 4.2 GHz sous une faible charge.
Il est remarquable que 3.La fréquence 9 GHz peut être atteinte même si tous les noyaux de processeur fonctionnent, mais il y a une marge suffisante pour l’overclocking automatique sans dépasser la consommation d’énergie et les limites de dissipation de chaleur.
En mode inactif cool’n’La technologie silencieuse réduit la fréquence d’horloge du processeur FX-8150 à 1.4 GHz. Le vcore dans ce cas tombe à 0.85 V.
Configuration de bilan d’essai
Nous allons comparer le nouveau processeur AMD FX-8150 à huit cœurs sur la microarchitecture de bulldozer à l’un de ses prédécesseurs – Six-Core Phenom II X6 ainsi que contre les concurrents d’Intel – quad-core I5-2500 et Core i7-2600. De plus, nous avons également ajouté les numéros de performance pour les processeurs de six cœurs Core i7-990X.
En conséquence, nos balises d’essai ont été construites en utilisant les composants matériels et logiciels suivants:
- Processeurs:
- AMD FX-8150 (Zambezi, 8 cœurs, 3.6 GHz, 8 Mo L2 + 8 Mo L3);
- AMD PHENOM II X6 1100T (Thuban, 6 cœurs, 3.3 GHz, 3 Mo L2 + 6 Mo L3);
- Intel Core i7-2600K (pont de sable, 4 cœurs, 3.4 GHz, 1 Mo L2 + 8 Mo L3);
- Intel Core i5-2500K (pont de sable, 4 cœurs, 3.3 GHz, 1 Mo L2 + 6 Mo L3);
- Intel Core i7-990x Edition Extreme (Gulftown, 6 cœurs, 3.46 GHz, 1.5 Mo L2 + 12 Mo L3).
- Gigabyte 990FXA-UD5 (socket AM3 +, AMD 990FX + SB950);
- ASUS P8Z68-V Pro (LGA1155, Intel Z68 Express);
- Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).
- 2 x 2 Go, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2 / 4GX);
- 3 x 2 Go, DDR3-1600 SDRAM, 9-9-9-27 (Crucial BL3KIT25664TG1608).
- Conducteur du chipset Intel 9.2.0.1030;
- Conducteur de moteur Intel Management 7.1.dix.1065;
- Technologie Intel Rapid Storage 10.6.0.1022;
- Catalyseur AMD 11.10 pilotes d’affichage.
Notez que nous avons effectué tous les tests sous la version Windows 7 actuelle, mais AMD indique que la tâche gère ce système d’exploitation’t Distribuez les threads de calcul de manière optimale. Windows 7 préfère principalement diriger tous les threads vers des cœurs à l’intérieur de différents modules. Et il offre en fait des performances relatives les plus élevées, car elle permet de réduire la charge sur les unités partagées à l’intérieur de chaque module. Cependant, cette stratégie empêche l’utilisation de modes de turbo, ce qui pourrait lancer si certains des modules de processeur dual core étaient en mode d’économie d’énergie.
Le prochain OS de Windows 8 fonctionnera différemment en attribuant d’abord les threads de calcul aux cœurs du même module. En conséquence, AMD promet que les performances de Zambezi peuvent augmenter jusqu’à 10% dans certaines applications sélectionnées.
Performance
Efficacité estimée de la nouvelle microarchitecture de bulldozer
Avant d’aller à la partie comparative réelle, nous avons décidé d’essayer de prédire ce que nous pouvions nous attendre à ce que la nouvelle microarchitecture de bulldozer soit capable en général. Pour ce faire, nous avons comparé le nouveau processeur à d’autres CPU sur les microarchitectures K10 et Sandy Bridge dans des environnements identiques créés synthétiquement: à la même fréquence d’horloge et avec le même nombre de cœurs actifs.
Pour être plus exact, nous avons comparé AMD FX-8150, PHENOM II X6 1100T et Core i7-2600 à 3.Fréquence 6 GHz et avec seulement deux noyaux de calcul actifs. Pour assurer la pureté de l’expérience, nous avons désactivé toutes les technologies d’économie d’électricité et de verrouillage automatique. Nous avons utilisé un ensemble de repères synthétiques simples dans Sisoft Sandra 2011 Suite, où nous avons manuellement désactivé toutes les instructions au-delà de SSE3, car la microarchitecture K10 ne fait pas’t Soutenez-les.
Les nombres de ce tableau parlent plus que les mots. La performance de la microarchitecture de bulldozer est devenue bien inférieure à celle des processeurs de génération précédente. La simplification de la microarchitecture de bulldozer en combinant une paire de noyaux en un seul module avec des ressources partagées a conduit à une baisse significative (25-40%) de performances spécifiques par rapport à la microarchitecture AMD de génération précédente. En conséquence, les noyaux de bulldozer ne fonctionnent pas seulement à la moitié de la vitesse des noyaux de pont de sable. En plus de cela, les performances du module de processeur de bulldozer avec deux cœurs sont encore plus faibles que celles d’un seul noyau de pont de sable avec une technologie hyper-threading activée. Devrions-nous nous attendre à des enregistrements de performance d’un CPU avec une telle microarchitecture? C’est plus une question rhétorique…
En même temps que’s Jetez un œil aux caractéristiques pratiques du sous-système cache et mémoire. Pour estimer la performance de ces unités fonctionnelles, nous avons eu recours à un utilitaire Cachemm de la suite AIDA64. Nous avons utilisé DDR3-1600 SDRAM avec des horaires du 9-9-9-27-1T. Tout comme dans le cas précédent, les processeurs ont tous fonctionné à 3.Fréquence d’horloge 6 GHz.
Comme nous pouvons le voir, les latences pratiques de tous les caches et sous-système de mémoire dans les processeurs Zambezi ont augmenté. Nous en avons déjà discuté dans le chapitre consacré à la microarchitecture de bulldozer. Cependant, la bande passante de mémoire a augmenté presque dans tous les cas en raison des modifications de l’organisation interne de la mémoire de cache.
Dans le même temps, le contrôleur de mémoire à double canal le plus rapide et le sous-système de mémoire de cache le plus rapide sont ceux de Sandy Bridge. Bien qu’en termes de taille de cache, le bulldozer NE sera supérieur.
Performance générale
Comme d’habitude, nous utilisons la suite Bapco Sysmark 2012 pour estimer les performances du processeur dans les tâches à usage général. Il émule les modèles d’utilisation dans des applications de création et de traitement de contenu de bureau et numérique populaires. L’idée derrière ce test est assez simple: elle produit un seul score caractérisé les performances de l’ordinateur moyen.
Comme vous vous en souvenez probablement, Amd il y a un peu de temps, Amd a essayé de troll Sysmark en déclarant que ce n’était pas’t une référence objective en raison du “injuste” combinaison d’applications qu’il a utilisées. Cependant, à notre avis, cette plainte est injustifiée, car la performance a été estimée à l’aide de programmes largement répartis et très populaires. La contribution de chacun de ces programmes dans le score de test final est donnée sur le diagramme suivant:
Par conséquent, nous avons décidé de ne pas abandonner Sysmark 2012 et de continuer à utiliser cette suite pour estimer la performance dans les applications à usage général.
Le premier test s’est avéré une grande déception. Le processeur FX-8150 à huit cœurs n’est que 10% plus rapide que le phénomène à six cœurs II X6 1100T et bien sûr, il est bien derrière les processeurs Intel quad-core. Donc, ça ressemble à AMD’S Décision de construire un processeur avec de nombreux cœurs avec de faibles performances spécifiques au lieu d’utiliser un nombre modéré de cœurs complexes ne fait pas’TO.
Laisser’s Regardez de plus près les scores de performance que Sysmark 2012 génère dans différents scénarios d’utilisation.
Le scénario de productivité du bureau émule les tâches de bureau typiques, telles que l’édition de texte, le traitement des tables électroniques, la navigation par e-mail et Internet. Ce scénario utilise les applications suivantes: Abbyy FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft Powerpoint 2010, Microsoft Word 2010 et Winzip Pro 14.5.
Le scénario de création de médias émule la création d’un clip vidéo utilisant des images et des vidéos numériques précédemment prises. Ici, ils utilisent des suites Adobe populaires: Photoshop CS5 Extended, Premiere Pro CS5 et After Effects CS5.
Le développement Web est un scénario imitant la conception de sites Web. Il utilise les applications suivantes: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 et Microsoft Internet Explorer 9.
Le scénario d’analyse des données / financières est consacré à l’analyse statistique et à la prédiction des tendances du marché effectuées dans Microsoft Excel 2010.
Le scénario de modélisation 3D est entièrement dédié aux objets 3D et le rendu des scènes statiques et dynamiques utilisant Adobe Photoshop CS5 étendu, Autodesk 3DS Max 2011, Autodesk AutoCAD 2011 et Google Sketchup Pro 8.
Le dernier scénario appelé System Management crée des sauvegardes et installe des logiciels et des mises à jour. Il s’agit de plusieurs versions différentes du programme d’installation de Mozilla Firefox et Winzip Pro 14.5.
Le processeur basé sur des bulldozer montre différents résultats dans différents modèles d’utilisation. Dans certains cas, il fonctionne encore plus lent que le phénomène II x6, mais il y a aussi quelques situations opposées. Dans l’ensemble, la règle générale peut être définie comme suit: FX-8150 est particulièrement efficace dans les applications avec une charge multi-thread et bien parallèle, ce qui n’est pas difficile en même temps de calcul.
Cependant, même dans les situations les plus favorables, le FX-8150 se tient en retard sur Core i5-2500. Le seul scénario où ces processeurs démontrent une vitesse comparable est le rendu 3D. À part cela, le produit Intel est en moyenne 25% plus rapidement, ce qui est un peu triste…
Performance de jeu
Comme vous le savez, c’est le sous-système graphique qui détermine les performances de toute la plate-forme équipée de processeurs assez à grande vitesse dans la majorité des jeux contemporains. Par conséquent, nous faisons de notre mieux pour nous assurer que la carte graphique n’est pas trop chargée pendant la session de test: nous sélectionnons les tests les plus dépendants du processe. En d’autres termes, les résultats obtenus nous permettent d’analyser non pas autant le taux FPS qui peut être obtenu dans des systèmes équipés d’accélérateurs graphiques contemporains, mais plutôt la façon dont les processeurs contemporains peuvent faire face à la charge de travail de jeu de jeu. Par conséquent, les résultats nous aident à déterminer comment les processeurs testés se comporteront dans un avenir le plus proche, lorsque de nouveaux modèles de cartes graphiques plus rapides seront largement disponibles.
Les jeux ne font pas partie de ces tâches qui créent des charges multithreads parallèles. Par conséquent, les processeurs quadricages conviennent aux joueurs’ a besoin beaucoup mieux que AMD’s monstres multi-cœurs. Les diagrammes ci-dessus sont un excellent exemple de cela. Le nouveau FX-8150 à huit cœurs n’est pas plus rapide que son prédécesseur à six cœurs – Phénom II X6.
Quant à la corrélation de performances de jeu entre Zambezi et Sandy Bridge, les choses ne sont pas loin d’être si optimistes pour AMD. La microarchitecture Intel actuelle s’enfuit beaucoup mieux avec la charge de travail typique créée par les jeux 3D et il n’y a absolument aucun espoir qu’AMD parviendra jamais à rattraper la compétition ici. En d’autres termes, la seule fois où il est logique d’utiliser un bulldozer pour le jeu serait la situation où vous êtes absolument sûr que le processeur donné sera assez rapide dans le sous-système graphique spécifique et dans des jeux spécifiques. Cependant, même dans ce cas, il est important de comprendre que la prochaine mise à niveau de la carte graphique peut avoir un effet négatif et vous serez dans une pire situation que les utilisateurs qui ont initialement préféré une plate-forme Intel.
En plus de nos tests de jeu, nous aimerions vous offrir les résultats du test Synthetic FutureMark 3Dmark11 avec le profil des paramètres extrêmes.
Nous avons ajouté ces résultats afin de montrer la situation idéale pour FX-8150, à savoir lorsque le sous-système vidéo ne fait pas’T permet en fait au processeur de montrer son plein potentiel. Dans ce cas, la carte graphique est chargée au maximum et le CPU remplit une fonction auxiliaire. Dans ce cas, nous pouvons dire que les processeurs de bulldozer et de ponts de sable sont tout aussi rapides, bien que ce ne soit pas exactement vrai.
Cependant, le nouveau FX-8150 semble assez bon dans le test de physique 3DMARK11 (en particulier dans le contexte des résultats précédents). Le nouveau processeur AMD à huit cœurs fonctionne de manière comparable avec le quad-core Intel Core i5-2500 pendant le calcul multi-thread du modèle de physique de jeu.
Performance dans les applications
Je dois dire que les performances générales et de jeu du nouveau bulldozer de bureau se sont avérées plus basses que ce à quoi nous nous attendions. Cependant, nous n’abandonnons pas et sommes prêts à rechercher des situations où une nouvelle microarchitecture AMD brillera vraiment.
Pour tester les performances des processeurs pendant l’archivage des données, nous avons recours à un utilitaire d’archivage Winrar. En utilisant le taux de compression maximum, nous archivons un dossier avec plusieurs fichiers 1.4 Go de taille totale.
Les performances FX-8150 se révèlent près de celles du Core i5-2500. Winrar n’est pas l’une de ces applications qui peuvent diviser la charge en huit fils parallèles pour les huit cœurs de bulldozer, mais la gémition du cache gigantesque semble sauver la situation ici.
Le deuxième test similaire de la vitesse d’archivage est effectué dans 7-zip qui utilise l’algorithme de compression LZMA2.
FX-8150 fait vraiment très bien dans 7-zip. Ce processeur à huit cœurs s’approche très près du quad-core Core i7-2600 avec un hyper-threading activé, qui peut également exécuter huit threads en même temps, tout comme le nouveau bulldozer.
Les performances du processeur pendant le chiffrement sont mesurées avec une référence intégrée à partir d’une utilité cryptographique populaire appelée TrueCrypt. Je dois dire qu’il peut non seulement utiliser efficacement n’importe quel nombre de cœurs de processeur, mais aussi soutenir des instructions spéciales AES.
Les algorithmes entiers simples bien tapissés sont exactement ce dont les besoins de microarchitecture au bulldozer. Comme nous pouvons le voir, les performances peuvent être assez impressionnantes dans ce cas. À savoir, le seul processeur FX-8150 pourrait’T Outperform était le Core I7-990X à six cœurs. Quant à tous les processeurs LGA1155, notre héros était bien en avance.
Nous utilisons un utilitaire Apple iTunes pour tester la vitesse de transcodage audio. Il transcode le contenu d’un disque de CD au format AAC. Notez que la particularité typique de cet utilitaire est sa capacité à utiliser uniquement une paire de cœurs de processeur.
Les applications générant peu de threads de calcul ne correspondent pas bien à Bulldozer. Les noyaux individuels de ce processeur sont trop faibles pour bien performer ici.
Nous avons mesuré les performances dans Adobe Photoshop en utilisant notre propre benchmark fabriqué à partir d’artistes Retouch Test de vitesse Photoshop qui a été modifié de manière créative. Il comprend l’édition typique de quatre images de 10 mégapixels à partir d’un appareil photo photo numérique.
Dans Photoshop FX-8150 ne’t permettent de fonctionner aussi mal que les processeurs basés sur K10, mais il n’est toujours pas en mesure de rattraper le Core i5-2500. Dans ce cas, une grande mémoire de cache aide beaucoup la microarchitecture au bulldozer, mais il ne suffit pas de garantir la victoire. L’efficacité et les performances spécifiques des noyaux de calcul sont toujours le principal facteur.
Nous avons également effectué quelques tests dans le programme Adobe Photoshop Lightroom 3. Le scénario de test comprend le post-traitement et l’exportation au format JPEG de cent images de 12 mégapixels au format brut.
Lightroom est capable de diviser le traitement de la photo entre un nombre de cœurs, c’est pourquoi le FX-8150 à huit cœurs est assez bien ici. Bien que je dois admettre que “plutôt bien” pourrait être considéré comme un terme très relatif dans ce cas, car ses performances ne sont comparables que celles du noyau i5-2500. Et donc cela signifie que deux noyaux de bulldozer équivaut à un noyau de pont de sable sans hyper-threading.
La performance dans Adobe Premiere Pro est déterminée par le moment où il faut pour rendre un projet Blu-ray avec une vidéo HDV 1080p25 dans H.264 format et y appliquer différents effets spéciaux.
Les processeurs AMD de génération précédente ont assez bien fait face à la transcodage vidéo. La microarchitecture de bulldozer a fait encore mieux dans ce type d’applications, c’est pourquoi FX-8150 fonctionne encore plus rapidement que le Core i5-2500.
Nous avons estimé la vitesse d’édition vidéo dans Adobe After Effects en mesurant le temps qu’il a fallu pour appliquer une combinaison de filtres et d’effets spéciaux tels que le flou, le gonflement, la clé de couleur, le mélange de trame, l’éclat, le flou de mouvement, la décoloration, la manipulation 2D et 3D, les ombres, l’écho, la médiane, le flou radial, l’inverti.
Bien qu’il s’agisse d’un type de charge bien parallèle, le FX-8150 prend derrière les concurrents Intel dans les effets après les effets.
Afin de mesurer à quelle vitesse nos participants à nos tests peuvent transcoder une vidéo en h.264 Format Nous avons utilisé x264 HD Benchmark. Il fonctionne avec une vidéo MPEG-2 originale enregistrée en résolution 720p avec un débit binaire de 4 Mbps. Je dois dire que les résultats de ce test sont d’une grande valeur pratique, car le codec x264 fait également partie de nombreux utilitaires transcodants populaires, tels que Handbrake, Megui, VirtualDub, etc.
Les processeurs AMD ont toujours bien performé lors des tests de transcodage vidéo x264. Maintenant que leur microarchitecture à huit cœurs est sortie, les résultats se sont encore améliorés. FX-8150 surpasse même le noyau i7-2600 lors de la deuxième passe la plus avide de ressources. Donc, enfin, nous avons trouvé une deuxième application, en plus de TrueCrypt, où les processeurs sur la microarchitecture de bulldozer font absolument très bien.
La vitesse de rendu dans Autodesk 3DS Max 2011 a été mesurée à l’aide d’un test spécial SpecAPC. En commençant par cette revue, nous allons utiliser une nouvelle version professionnelle de SpecAPC pour 3DS Max 2011.
Le rendu est également une tâche, qui est bien optimisée pour les microarchitectures multicœurs. Cependant, malgré ce fait, le FX-8150 fonctionne toujours plus lent que le Core i5-2500 et le Core i7-2600, sans parler du Core i7-990X. D’un autre côté, le nouveau processeur AMD ne fait pas’t perdre contre son prédécesseur, donc les choses sont’t Mauvais après tout.
Résumé tous les résultats obtenus dans des applications individuelles, nous pouvons conclure que dans nos tests, le nouveau FX-8150 était environ 14% plus rapide que le phénomène II x6 1100T. En conséquence, ce n’était pas plus lent que le Core i5-2500 dans près de la moitié de tous les tests. Cependant, le décalage derrière le mode Intel suivant, Core i7-2600, reste assez sérieux et dépasse 10%.
Consommation d’énergie
Bien que nous ayons réussi à trouver un ensemble d’applications où les performances du bulldozer sont assez bonnes, les CPU basés sur cette nouvelle microarchitecture sont loin d’être considérés comme révolutionnaires. Notre seul espoir à ce stade est la consommation d’énergie, car les processeurs AMD précédents étaient bien derrière leurs concurrents dans cet aspect. Maintenant, cependant, la nouvelle microarchitecture est promise d’être beaucoup plus économe en énergie. De plus, le nouveau processus plus fin 32 nm aurait dû contribuer à l’amélioration des caractéristiques électriques des nouveaux processeurs. alors laisse’S Consultez les performances par watt du nouveau FX-8150.
Les graphiques ci-dessous montrent le tirage à pleine puissance de l’ordinateur (sans le moniteur) mesuré après l’alimentation. C’est le total de la consommation d’énergie de tous les composants du système. Le bloc’L’efficacité de S n’est pas prise en compte. Les CPU sont chargés en exécutant le Linx 0 64 bits.6.4 utilitaire. Nous avons activé toutes les technologies d’économie d’énergie pour une mesure correcte de l’ordinateur’s Power Draw en mode inactif: C1E, C6, AMD Cool’n’Intel SpeedStep calme et amélioré.
En cas de chargement unique, la consommation d’énergie de socket AM3 + Système augmente rapidement, ce qui se produit très probablement en raison de la technologie turbo très agressive. Les systèmes de base Intel ne démontrent rien de tel et ils peuvent à nouveau se vanter d’une bien meilleure efficacité énergétique.
En cas de chargement multiplié lourd, les choses ne changent pas vraiment beaucoup. La seule différence est que le système LGA1366 avec le noyau i7-990x à l’intérieur se précipitait vers l’avant. Sinon, les choses sont exactement les mêmes. FX-8150 peut’t avec un succès spécifique d’économie de puissance. Il consomme un peu moins que le phénomène II x6 1100T, mais les processeurs Intel Sandy Bridge sont encore au moins 1.5 fois plus économe en énergie.
AMD a utilisé toute l’efficacité énergétique qu’ils ont acquise de la nouvelle microarchitecture pour augmenter les vitesses d’horloge. Et en fin de compte, il n’y a principalement une amélioration significative ni dans l’efficacité énergétique ni la performance. Par conséquent, dans l’aspect performance par watt, le nouveau bulldozer, tout comme ses prédécesseurs, est toujours sérieusement à l’origine des microarchitectures Intel concurrentes.
Pour votre référence, voici les lectures de consommation électrique du processeur isolé et des rails d’alimentation de la carte principale:
Le “pur” La consommation d’énergie du FX-8150 à huit cœurs est environ deux fois plus élevée que celle des processeurs de ponts de sable. Étant donné que tous sont fabriqués en utilisant le même processus de production et ont une tension centrale similaire, il devient extrêmement intéressant ce que AMD entendait exactement par l’efficacité énergétique de leur microarchitecture au bulldozer.
Overclocking
Les processeurs Socket AM3 + Platform et FX-Series sont positionnés comme adaptés aux overclocking dès le départ. Cela résulte non seulement du fait que tous les processeurs FX ont des multiplicateurs déverrouillés, mais aussi à partir d’un certain nombre d’expériences de surclocking extrêmes soutenues par AMD, dans l’une desquelles ils ont établi un record du monde d’overclocking en utilisant un nouveau processeur FX-8150. L’entreprise’La déclaration sur la nouvelle microarchitecture bien optimisée pour le travail à haute fréquence semble également très prometteuse. Serait-ce une nouvelle merveille overclocking? Laisser’s découvrir.
Il est extrêmement facile d’overclocker tous les processeurs FX: leur logo indique “Débloqué” pour une raison. Vous pouvez modifier la fréquence de l’horloge du processeur en modifiant son multiplicateur en droite dans la configuration du BIOS de la carte principale, ou via des utilitaires spéciaux d’AMD (Utilitaire Overdrive) ainsi que des fournisseurs de panneaux principaux. Vous pouvez également overclocker le pont nord et la mémoire du système intégré dans le système Socket AM3 + de la même manière.
Au cours de nos tests, nous avons réussi à faire fonctionner notre FX-8150 à 4.6 GHz. Pour une stabilité accrue, nous avons augmenté la tension du noyau du processeur à 1.475 V et option d’étalonnage de la ligne de charge activée. Pendant notre stabilité teste, la température du CPU à cette fréquence n’a pas été’t dépasser 85 ° C, selon la diode sous-sockée et 75 ° C, selon la diode thermique intégrée dans le CPU lui-même. Comme nous l’avons déjà dit, nous avons utilisé un refroidisseur d’air très efficace – NZXT HAVIK 140.
Notez que nous avons également essayé d’overclocker simultanément le pont nord intégré au processeur, car l’augmentation de sa fréquence aura un effet positif sur la mémoire du cache L3 et les performances du contrôleur de mémoire. Cependant, malheureusement, nous ne pouvions pas’T dépasser 2.Fréquence 4 GHz Même si nous avons essayé d’augmenter sa tension également.
Dans tous les cas, le résultat de notre expérience d’overclocking FX-8150 – 4.Fréquence 6 GHz – est un succès définitif, d’autant plus que les processeurs AMD Phenom II II ont rarement overclocké au-delà de 4.0 GHz avec refroidissement à l’air. En d’autres termes, la microarchitecture au bulldozer a vraiment réussi à pousser les maximums de fréquence un peu plus loin.
Cependant, nous devons en fait comparer les résultats de nos processeurs FX en overclocking avec ceux des processeurs Intel Core i5 et Core i7 pour les systèmes LGA1155. Et ces gars overclockent tout aussi bien. Par exemple, le Core i5-2500K overclockera généralement à 4.7 GHz sous un refroidisseur aérien et avec le vcore augmenté de 0.15 V. Et dans cette comparaison, FX-8150’T a l’air si victorieux plus.
Notre impression de Zambezi Overclocking sera encore plus gâtée si nous comparons les performances du FX-8150 et du Core i5-2500k overclocké (l’augmentation par rapport au mode nominal est donnée en supports):
Dans l’ensemble, l’overclocking ne fait pas’t vraiment changer la situation. Cependant, dans les applications où FX-8150 était plus rapide en mode nominal, l’écart n’est plus aussi dramatique. Et dans les tests où le Core i5-2500 était en avance, il a réussi à renforcer encore plus ses positions. En fait, il n’est pas surprenant du tout: la fréquence d’horloge de notre processeur FX-8150 a augmenté de 28% pendant l’overclocking, tandis que la fréquence du noyau i5-2500k a augmenté de 42%. De plus, comme nous pouvons le dire de la façon dont la fréquence a augmenté pendant l’overclocking, la microarchitecture Intel Sandy Bridge est plus sensible à l’augmentation de la fréquence. En d’autres termes, même si nous prenons en compte l’overclocking, les nouveaux processeurs de bulldozer Don’T a l’air supérieur à Intel’S ceux, même s’ils overclockent assez bien.
Conclusion
Alors, est-ce le succès ou l’échec? Je suis sûr que la plupart d’entre vous aimeraient voir un verdict clair et défini ici. Cependant, les choses ne sont pas si simples cette fois et AMD Bulldozer a rendu les choses vraiment difficiles pour tous les critiques.
Le fait est qu’AMD a révélé une approche totalement unique pour développer une nouvelle microarchitecture. En gardant à l’esprit que la performance du processeur se compose de trois composants majeurs, tels que le nombre d’instructions par horloge, la fréquence de base et le nombre de cœurs, les ingénieurs AMD ont déplacé leurs priorités vers le nombre de cœurs cette fois. Ils ont abaissé les performances de base spécifiques, mais en même temps ont eu l’occasion de créer des processeurs à huit cœurs bon marché ou encore plus complexes. Il s’agit d’une étape très importante pour le marché des serveurs où les charges multi-thread dominent et les processeurs multi-core sont en forte demande. Ainsi, la nouvelle microarchitecture de bulldozer d’AMD aidera très probablement l’entreprise à renforcer ses positions dans le segment des serveurs hautes performances.
Cependant, aujourd’hui, nous vous avons présenté un processeur FX basé sur la nouvelle microarchitecture de bulldozer mais conçu pour le segment de bureau. Et c’est là que nous avons observé un décalage dramatique entre le bulldozer’S fonctionnalité matérielle et besoins des applications de bureau typiques. Il est particulièrement frustrant que l’ensemble des efforts de marketing visait à nous faire croire que Bulldozer sera l’étoile montante du marché du bureau. Malheureusement, cela ne s’est jamais produit.
Les processeurs FX basés sur la microarchitecture de bulldozer n’ont réussi à montrer leurs forces que dans une petite variété de tâches utilisateur courantes. Il y a très peu d’applications populaires, qui généreraient une simple charge entière multithreade et c’est le seul cas où Bulldozer fonctionne vraiment à son meilleur. En conséquence, dans certaines applications, le nouveau bulldozer n’est pas seulement plus lent que les concurrents d’Intel, mais est encore plus lent que le phénomène de génération précédente II X6. Et cela signifie qu’Amd a fait’T réussi à lancer un processeur de bureau révolutionnaire.
En fait, FX n’est qu’un autre phénomène, qui a l’air plutôt bien, surtout par rapport aux prédécesseurs. Dans l’ensemble, les processeurs FX sont plus rapides que le phénomène II, ils overclockent beaucoup mieux et consomment un peu moins de puissance, ils seront donc un bon remplacement pour les CPU sur la microarchitecture Old K10.
Cependant, je voudrais vous rappeler qu’AMD est en compétition non seulement contre lui-même, mais aussi contre Intel. Par conséquent, nous devons tirer cette conclusion importune que les processeurs FX ne seront qu’un bon choix pour les systèmes de bureau qui seront principalement utilisés pour le traitement vidéo et le transcodage. Dans tous les autres cas, les processeurs de bulldozer ne peuvent malheureusement pas rivaliser avec Sandy Bridge. Il en va de même pour la consommation d’énergie ainsi que pour l’overclocking. Je voudrais également ajouter que les processeurs AMD FX s’avançaient très bien un mauvais choix pour les joueurs, car les jeux 3D contemporains utilisent à peine de vrais algorithmes multithreads. Cependant, je suis sûr que les fans dédiés AMD pourront supporter cela, car le taux FPS dans les jeux est dans la plupart des cas limités par la carte graphique, plutôt que le processeur.
En d’autres termes, la réussite marketing des nouveaux processeurs FX dépendra uniquement de deux facteurs: la façon dont la Club de Fan-Club AMD est intelligente et comment l’entreprise utilisera ses stratégies de tarification. Mais de toute façon, les processeurs de bulldozer de bureau ne deviendront presque jamais vraiment populaires.