發(fā)送到非對角線單元中的數(shù)據(jù)是旋轉(zhuǎn)矢量的同相部分和正交部分除以相應(yīng)的近似值得出的結(jié)果。我們不僅通過在對角線單元和非對角線單元采用流水線架構(gòu)實現(xiàn)了高數(shù)據(jù)吞吐量,同時還通過對跨5個信道的硬件進行時分復(fù)用的方式控制了近似值模塊和復(fù)雜乘法器引起的時延。
對4x4矩陣,我們使用了1個對角線單元和7個非對角線單元。分解單個矩陣所花的處理時間為4x4=16個數(shù)據(jù)周期,而該設(shè)計交付數(shù)據(jù)的速度是每三個時鐘周 期一個樣本,因此分解單個矩陣的所用總時長為3x4x4=48個時鐘周期(低于可用的64個時鐘周期)。我們對分解后的矩陣使用了回代法(back substitution),同時以相同的TDM方式進一步進行了重新排序操作。
球形檢測器
球形檢測器采用PED單元進行范數(shù)計算。根據(jù)樹的層次,我們采用了三種不同類型的PED單元。根節(jié)點PED模塊負(fù)責(zé)計算所有可能的PED。二級PED模塊針 對上一級計算得出的8個幸存路徑計算出8個可能的PED。這樣在樹的下一級索引中,我們就有64個生成的PED。第三種類型的PED模塊用于其它樹級,負(fù) 責(zé)計算上一級計算出的所有PED的最鄰近的節(jié)點PED。
球形檢測器(SD)的流水線架構(gòu)可以在每個時鐘周期中處理數(shù)據(jù)。其結(jié)果就是樹的每級只需要一個PED模塊。因此,對4x4 64-QAM系統(tǒng)而言,PED單元的總數(shù)為8,與樹的級數(shù)相等。
SD可以采用硬解碼和軟解碼兩種類型的解碼技術(shù)。硬解碼能夠用貫穿樹的各級的最小距離矩陣度量次序;軟解碼用對數(shù)似然比來代表輸出的每個比特。對數(shù)似然比一般被當(dāng)作優(yōu)先輸入值提供給信道解碼器,比如turbo解碼器。
FPGA資源占用