Domanda:
Perché non realizziamo CPU con migliaia di strati per utilizzare lo spazio nella terza dimensione?
Ethan
2020-07-27 12:38:02 UTC
view on stackexchange narkive permalink

Mi chiedo perché non realizziamo processori come CPU con migliaia di strati sovrapposti per utilizzare lo spazio nella terza dimensione ora che abbiamo i transistor tridimensionali. Per essere chiari, mi riferisco alla creazione di un processore a forma di prisma rettangolare.

Per essere chiari, c'è una quantità enorme di cui non sono a conoscenza quando si tratta di produzione di processori, non sono un ingegnere elettrico o informatico, ma sono molto curioso. Sono consapevole dei problemi di riscaldamento che ciò causerebbe considerando un imballaggio ancora più denso di transistor e dei problemi di produzione considerando che dovresti incidere al laser attraverso così tanto silicio, ma a differenza dell'ingrandimento delle dimensioni in larghezza e altezza non ci sarebbero problemi con sfruttando al meglio i wafer di silicio circolari, e diversamente da questo si terrebbero le parti molto vicine, il che significa che non rallenterebbe la velocità dell'elettricità che passa da una parte all'altra del processore perché il processore ha già 1000 di transistor impilati orizzontalmente e verticalmente.

Sono curioso di sapere se si potrebbero risolvere i problemi di riscaldamento stendendo strati sottili intermittenti di dissipazione del calore, mantenendo il rendimento verticale. E risolvere parzialmente i problemi di produzione utilizzando wafer incisi separatamente ogni 10 strati circa. Potrebbe essere possibile o ci sono molti problemi a cui non penso (e sono sicuro che ci siano)? Grazie.

Come immaginate che funzionino esattamente questi "strati sottili di dissipazione del calore"?Un dissipatore di calore non "assorbe" veramente il calore come in "lo distrugge", lo conduce semplicemente via.Uno strato all'interno della pila può aiutare solo conducendo calore ai lati dello stampo, e questa è una strada * lunga * da percorrere (almeno diversi millimetri), rendendolo orribilmente inefficiente.
Perché non facciamo 1000 torte a strati?Dopo un certo numero di strati inizia a sfaldarsi, non posso ripararlo con la glassa.
@old_timer Il tuo esempio è mal scelto: https://en.wikipedia.org/wiki/Mille-feuille
Non ho visto alcuno strato 10-20-100-1000, anche quando pieghi la pasta molte volte non crea uno strato coerente, specialmente dopo la lavorazione (cottura).In entrambi i casi ogni strato ha incongruenze che si amplificano su ogni strato successivo (vedi risposte sotto) se potessi risolvere il problema del calore allora hai il problema dell'impilamento.Proprio come una torta.Una torta a 50 strati per scopi di premio / premio sicuramente, ma produrli in serie, non così tanto.Certamente non uno strato 1000.
poi c'è anche il costo, le maschere sono una parte importante del costo di un chip, se un piccolo numero di strati è una manciata di decine di milioni allora 1000 strati sono ... più di quanto vale l'azienda.E questo se potessi trovare l'attrezzatura per farlo.è una domanda stupida.stiamo solo rendendo i moduli multi chip comuni oltre i prodotti di fascia alta.Se il tuo processo è la metà delle dimensioni del precedente, è più o meno lo stesso che impilare il doppio.quindi non è che non stiano facendo nulla per aumentare la densità e le prestazioni per "chip"
(non tutti i soldi sono nelle maschere, non cercando di implicarlo, gli strumenti di sviluppo da soli sono milioni di dollari)
@TooTea Sono d'accordo che sarebbe "orribilmente inefficiente" Ho solo pensato che se si potesse in qualche modo eseguire un cavo del dissipatore di calore thickkk direttamente dalla CPU e collegarlo attorno a un radiatore con una ventola, potrebbe essere possibile attirare abbastanza calore per farlofattibile.Ma questa è ovviamente un'ipotesi completa e il calore coinvolto potrebbe benissimo essere folle, quindi mi aspetto che non funzioni altrettanto bene.
In generale la conducibilità termica dipende dall'area perpendicolare alla direzione del trasferimento di calore.Dato che il calore deve raggiungere i bordi, questi strati di "dissipatore di calore" dovranno essere piuttosto spessi.La mia ipotesi è che sia nell'ordine dei millimetri.Tutti i tubi del refrigerante saranno più o meno gli stessi.Quindi la separazione dei livelli in modo efficace non sarà troppo lontana dagli slot PCIe.
@James_pic Mille-feuille è solo un nome.Le torte reali hanno 10-20 strati superiori (controlla le immagini nella pagina a cui sei collegato).
@old_timer Gli edifici sono normalmente da 10 a 20 a 160 strati / piani.Le stampe 3D sono centinaia di strati.I diamanti sono naturali e stampati in 3D innumerevoli strati.
Sei risposte:
Neil_UK
2020-07-27 13:54:38 UTC
view on stackexchange narkive permalink

Le due ragioni principali sono la resa e il calore.

Resa.Ogni volta che esegui una fase del processo, ottieni meno del 100% di perfezione.Supponiamo che tu ottenga il 99% di perfezione per passaggio.In un processo con 20 passaggi, scenderai all'82%.In un processo con 1000 passaggi, si ridurrebbe a 43 ppm, 43 build riuscite per ogni milione di wafer avviato.

Calore.I nostri progetti esistenti sono già limitati dalla velocità con cui possiamo estrarre il calore dal fondo dello stampo.Quindi né l'opportunità di generare più calore, né l'opportunità di generare quel calore più lontano da dove può essere dissipato, è di alcuna utilità per noi.

Detto questo, ci sono alcuni dispositivi che si stanno sviluppando nella terza dimensione, unendo insieme diversi wafer finiti, il che mitiga il problema del rendimento.Quei wafer impilati tendono ad essere memoria, che non usa nulla come la potenza di una CPU, il che mitiga il problema del calore.

Potresti impilare pezzi che sono stati fatti separatamente.Il vero problema è il calore.
Ho sentito parlare di DRAM sovrapposta e potremmo vederne di più dato che hanno già superato i test.È forse l'unico modo pratico per costruire verso l'alto fino a raggiungere un limite di dissipazione del calore.
Flash è spesso impilato da morire, utilizzando 16 o più dadi impilati insieme.Qui il calore è meno problematico in quanto gli strati extra sono per la capacità: stai accedendo solo a uno strato alla volta.Questo è meno facile da fare per le CPU in cui ti aspetti che siano tutte occupate allo stesso tempo.
Come hai detto alla fine, stavo pensando che avrebbero impilato / incollato insieme wafer finiti come impilare 100 i7 o i3 uno sopra l'altro per ottenere un i7-100 o un i3-100 quei processori hanno già circa 10 strati, quindi è lìne ottieni 1000, e questo ovviamente costerebbe 100 volte quello di un i3 o i7 esistente e i guadagni in termini di prestazioni non sarebbero esattamente 1 a 1, ma i miglioramenti della densità supererebbero la perdita di prestazioni per i produttori di supercomputer.E se potessi aggiustare il riscaldamento con una spessa linea di dissipatore di calore a strati intermittenti direttamente su un radiatore (grande se) Allora, sì.
@Ethan722 Una CPU di fascia alta ha oltre un miliardo di transistor con oltre 20 core.Ciò che gli ingegneri vogliono non sono CPU impilate ma un ulteriore livello di dram o flash, anche come dadi separati.Quello che proponi non accadrà nella nostra vita.La densità estrema crea SEMPRE troppo calore per essere praticabile.
Il nostro limite di calcolo attuale è molto raro nella potenza di elaborazione della CPU.L'accesso ai dati è il collo di bottiglia principale ed è valido da decenni.Per un computer tipico, l'aggiornamento da HDD a SSD e l'aggiornamento della RAM offre il miglior rapporto qualità-prezzo. C'è un motivo per cui gli inserzionisti segnalano il "BIG HERTZ" della CPU e ti danno un computer con 2-4 Gb di RAM;il sistema si degraderà molto rapidamente e penserai di aver bisogno di uno nuovo, quando un aggiornamento di $ 100 di RAM lo farà durare altri 5-10 anni.
@Ethan722 (non un esperto di EE, ma solo un tecnico di passaggio) La dissipazione del calore è un problema molto più grande di quanto non faccia il tuo commento.Un singolo AMD Threadripper 3990x può erogare circa 280 W di calore.Se in qualche modo potessi impilarli in altezza 100, ora stai parlando di dissipare (280W * 100) = 28KW di calore.
Intel sta attualmente progettando qualcosa di simile con la sua tecnologia di stacking Foveros.
Le CPU @Ethan722, hanno superato i limiti termici da circa 20 anni.Una CPU piatta emette più calore per millimetro quadrato rispetto a un fornello;la tua proposta "CPU impilata" supererebbe quella di un reattore nucleare.
analogsystemsrf
2020-07-27 13:02:01 UTC
view on stackexchange narkive permalink

La rimozione del calore è il problema.

Alcuni chip hanno già una densità energetica maggiore di un reattore nucleare.

Considera un asciugacapelli: 1.500 watt con una ventola air_blast per raffreddare le bobine di tungsteno.E le bobine si illuminano di rosso opaco.

Densità di potenza, sicuramente.Ciò significa che hanno anche una densità di potenza maggiore rispetto al sole, giusto?
"Reattore nucleare" in questo contesto, si riferisce a una reazione di ** fissione ** controllata.Un reattore ** a fusione ** sarebbe paragonabile al sole, ma qualsiasi circuito funzionante a livelli di potenza comparabili non durerebbe a lungo.
[Apparentemente] (https://physics.stackexchange.com/questions/370899/suns-power-density-compared-to-a-compost-heap) la densità di potenza del sole non è poi così impressionante
@ManfP Sì, ma può durare 10 miliardi di anni con un addebito, quindi è qualcosa ...
@J ... che è utile perché ogni volta che ci si avvicina con un cavo di ricarica USB si scioglie.
@user253751 Il tuo corpo ha una densità di potenza maggiore rispetto al sole.
Felix S
2020-07-27 13:00:52 UTC
view on stackexchange narkive permalink

Ma cosa ne ricaveresti?

  1. Il numero di transistor per mm² di maschera che ottieni sarebbe sempre lo stesso, avresti solo più maschere
  2. L'allineamento di più maschere è molto più difficile, più maschere devono essere allineate.
  3. Probabilmente avrai bisogno di più strati di interconnessione aggiuntivi per ogni strato di transistor aggiuntivo
  4. Creare una connessione tra i livelli è più faticoso che creare una connessione all'interno di un livello.
  5. La dissipazione del calore sarebbe peggiore
Alcuni computer, ad es.https://en.wikipedia.org/wiki/Titan_(supercomputer) hanno utilizzato topologie di connessione 3D quindi la distanza tra molti nodi è inferiore.1023 core su wafer da 50μm impilati uno sopra l'altro avrebbero una distanza di gran lunga inferiore tra loro rispetto a una griglia 2D di 32 core per lato, sufficiente per condividere i clock GHz ecc.
pjc50
2020-07-27 13:41:14 UTC
view on stackexchange narkive permalink

I transistor sono molto più facili da realizzare sullo strato inferiore, perché la struttura tradizionale comprende strutture "n-well" o "p-well".

Inoltre: Planarisation.

Lo strato inferiore del "substrato" è lucidato meccanicamente con un grado di planarità molto elevato.Gli strati successivi sulla parte superiore vengono incisi e depositati, ma ogni volta è tutt'altro che perfetto.Esiste il rischio che la somma degli errori causi un mancato allineamento delle caratteristiche su un "grumo" della superficie.

Overmind
2020-07-27 15:51:55 UTC
view on stackexchange narkive permalink

Ci sono 2 ragioni principali:

  1. Dissipazione del calore: richiede una superficie di contatto. Quella superficie trasferisce il calore dalla CPU al sistema di raffreddamento. Se è 3D, diventa estremamente difficile evacuare il calore dagli strati inferiori poiché la superficie di contatto sarebbe significativamente inferiore a quella necessaria per sostenere il trasferimento termico.

  2. Rendimenti: in molti casi comunque sono bassi. Quando nVidia stava provando la GTX 285 / 295s avevano rendimenti iniziali inferiori al 2% e dopo la stabilizzazione del processo erano ancora inferiori al 10%. Ciò significava che dovevano tagliare parti del chip per ottenere carte di classe inferiore dalla rimanente parte buona. E questo con un processo 2D standard che era appena sovradimensionato. Provare a mettere qualsiasi cosa in 3D avrebbe rendimenti ancora inferiori se ignorassimo la parte riscaldante.

Inoltre, adattare completamente il processo fab (supponendo che tutto il resto vada bene) non è qualcosa che molti sarebbero disposti ad andare avanti mentre c'è di più dalla tecnologia attuale.

HBM Memory è riuscita a fare le cose in pile. Non è realmente 3D, è stato chiamato 2.5D perché ha solo pochi strati ed è una soluzione costosa. La dimensione del pacchetto è grande e comporta problemi di gestione termica (anche se il calore generato è significativamente inferiore rispetto alle CPU). L'avanzata tecnologia di confezionamento dei chip che collega verticalmente gli stampi di chip DRAM utilizzando elettrodi che penetrano negli stampi spessi micron attraverso fori microscopici è venuta in soccorso in questo caso.

HBM-- molte belle immagini di impilamento / interposer disponibili online.Inoltre non viene menzionato in altre risposte le memorie Flash NAND, che sono diventate verticali in grande stile, con [128 strati di celle impilati verticalmente] (https://www.google.com/search?q=128+layer+nand+flash + cross + sezione).Poiché solo 1 dei 128 potrebbe essere attivo, il caldo non è un problema.
Le NAND non vengono elaborate continuamente con la maggior parte delle loro "celle", quindi può essere abbastanza soddisfacente dal punto di vista del calore.
user5216459
2020-07-29 18:37:34 UTC
view on stackexchange narkive permalink

Il fatto è che gli scienziati di oggi non capiscono perché le cose si surriscaldano anche quando vengono applicate energie specifiche per ottenere un risultato specifico.

È tutto merito del potenziale energetico quantistico ottenere il capovolgimento di un transistor (sovraccarico / sottocarico) che non possono perfezionare a causa delle forze universali che agiscono sul tuo chip anche se è schermato, le forze stanno ancora interagendo con questi potenziali, queste interazioni sono meglio indovinate nella migliore delle ipotesi e non sembrano tenere conto del loro pensiero, lo spreco di energia viene emesso da tutti gli assi della geometria e non direttamente lungo il percorso di minor resistenza, anche le armoniche della sostanza l'energia è il trascinamento non è perfetto geometricamente, ma questo è solo un altro problema.

Sto divagando, l'impilamento 3D richiederebbe raccoglitori di rifiuti intermedi che assorbono l'energia di scarto dal chip invece di estrarre passivamente i rifiuti.

Pensa a ogni transistor come sovraccarico di fluttuazioni nel tempo che provocano un'emissione come una centrale elettrica quando si rompe uno spinterometro, l'energia deve andare da qualche parte prima che la connessione si interrompa alla prima connessione ma poiché non lo è, il transistor provoca un'emissione che irradia l'energia sotto forma di calore a causa dello schianto spontaneo di energia di scarto che cerca di innescare il transistor ma non può e quindi viene riflesso o l'energia continua a entrare in collisione con la geometria della cpu fino a quando non è fuori energia e ogni volta che riflette si rompe emettendo calore ..

Il trucco è avere un'elaborazione a cascata come una pila di carte in un triangolo, ogni naso in quella piramide di carte viene tracciato dall'inizio alla fine e l'energia rimanente verrebbe scaricata su un altro processore che è lì solo per RIEMPIRE IL RICHIESTE di assorbire l'eventuale energia di scarto.

Il motivo per cui desideri che un altro processore raccolga l'energia di scarto è perché l'energia deve dissiparsi e funzionare in modo naturale, il percorso di minor resistenza avviene su molte scale e forme, il tempismo è molto importante, più veloce è il tuo orologio, piùtempo devi giocare con l'energia che hai.

Mi piacerebbe sentire la persona che ha votato negativamente il mio commento e cercare di spiegarne diversamente e se ha votato del tutto, ma non dubito che sentirò da loro.
Non sono io quello che ti ha svalutato, ma ci sono alcune cose nella tua risposta che non hanno senso o sono semplicemente sbagliate.Energia che si schianta contro i transistor?L'energia non riesce ad attivare i transistor?Energia che si rompe?E il calore che ne deriva?La gente oggi non capisce perché le cose si scaldano?Un clock più veloce riduce il consumo di energia?
Cosa sono i "raccoglitori di rifiuti"?Questo non è un termine EE standard e non spieghi mai cosa sono o come funzionano.Lo stesso per "elaborazione a cascata".Una buona risposta dovrebbe essere comprensibile agli altri utilizzando la terminologia standard ove possibile e definendo i termini in caso contrario.
Ebbene, la risposta è incoerente.Se sta cercando di dire qualcosa, sta cercando di dire troppo con troppo poco.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 4.0 con cui è distribuito.
Loading...