-
$k$ -th user to the RIS ${\bf h}k \in \mathbb{C}^{M \times 1}$ $$ \mathbf{h}{k}=\mathbf{A}{M, k} \boldsymbol{\beta}{k} $$ - RIS to the BS:
${\bf H} \in \mathbb{C}^{N \times M}$ $$ \mathbf{H}=\mathbf{A}{N} \Lambda \mathbf{A}{M}^{\mathrm{H}} $$ - cascaded channel $\mathbf{G}{k}=\operatorname{HDiag}\left(\mathbf{h}{k}\right) \in \mathbb{C}^{N \times M}$
- angle-domain expression: $\mathbf{G}{k}=\mathbf{A}{N} \boldsymbol{\Lambda} \mathbf{A}{M}^{\mathrm{H}} \operatorname{Diag}\left(\mathbf{A}{M, k} \boldsymbol{\beta}{k}\right)$ $$ \begin{aligned} \mathbf{A}{N} &=\left[\mathbf{a}{N}\left(\psi{1}\right), \ldots, \mathbf{a}{N}\left(\psi{L}\right)\right] \in \mathbb{C}^{N \times L} \ \boldsymbol{\Lambda} &=\operatorname{Diag}\left(\alpha_{1}, \alpha_{2}, \ldots, \alpha_{L}\right) \in \mathbb{C}^{L \times L} \ \mathbf{A}{M} &=\left[\mathbf{a}{M}\left(\omega_{1}\right), \ldots, \mathbf{a}{M}\left(\omega{L}\right)\right] \in \mathbb{C}^{M \times L} \end{aligned} $$ $$ \begin{aligned} \mathbf{A}{M, k} &=\left[\mathbf{a}{M}\left(\varphi_{k, 1}\right), \ldots, \mathbf{a}{M}\left(\varphi{k, J_{k}}\right)\right] \in \mathbb{C}^{M \times J_{k}} \ \boldsymbol{\beta}{k} &=\left[\beta{k, 1}, \ldots, \beta_{k, J_{k}}\right]^{\mathrm{T}} \in \mathbb{C}^{J_{k} \times 1} \end{aligned} $$
基于角度域稀疏性的大规模MIMO系统关键技术研究
需要搞清楚的点:酉(unitary)变换、
主要参考文章1,首先复现该文章的角度域解法,同时对比其他benchmark
高速移动场景下的多普勒效应和多经效应难以解决,文了解决这一挑战,文中列举了四种研究方向:
- 直接对信道进行估计或预测(direct channel estimation/ prediction)
- 线性时变信道模型(Linearly Time-Varying, LTV)
- 基础扩展模型(basis expansion model, BEM)
- 正交时间空间频率调制(Orthogonal Time Frequency Space(OTFS) Modulation)
- 将时变多经信道转化为(time-invariant channel)时不变信道
- 角度域的DFO估计和补偿
- 基本思想:考虑到DFO的产生本身就是多径中AoA和AoD的不同造成的,所以直接从角度域进行DFO的估计和补偿。目前,在小规模和大规模MIMO系统中均有角度域估计的研究,但是基于最大似然(ML)的MIMO信道联合估计方法会引入较大的信道开销;而且无法获得空分增益和阵列信噪比增益。
- 基于码本的波束赋形和波束跟踪
- 不通过信道估计,直接尝试现有码本中的方案
- 遍历搜索(Exhaustive Search, ES)方案
- 分层搜索(hierarchical search,HS)方案。ES的低开销改进版
- 问题:量化误差(quantization error)和信道老化(channel aging);针对快衰落信道效果不佳(快速移动场景效果不好)
本文中发端和收端均采用大规模MIMO天线,在提高谱效的同时提高高速移动场景下的链路可靠性。
但是由于高维度的信道矩阵会造成高信道开销,并且现有方法(基于压缩感知 Compressive Sensing,CS )主要应用在满衰落信道中,无法应用在快衰落的高速移动场景下。
所以提出了一种方法:
- 角度域选择性信道跟踪和多普勒效应补偿方法(Angular-domain selective channel tracking and Doppler compensation scheme)
- 利用了mmWave大规模MIMO信道的动态稀疏性(dynamic sparsity)
- 在上下行链路应用预编码训练(precoded training)
主要贡献:
- 角度域选择性信道跟踪
- 角度域选择性信道补偿
- 基于动态变分bayesian 接口(dynamic VBI)
- three layer hierarchical Markov model
- 变分贝叶斯推理(Variational Bayesian Inference, VBI);稀疏贝叶斯学习(Sparse Bayesian Learning, SBL)无法直接应用
- 提出新的多普勒感知的动态VBI(Doppler-aware-dynamic Variational Bayesian inference, DD-VBI)
- 该方法将VBI和信息传递方法(message-passing approaches)相结合
单用户时分系统
分为上行和下行两种subframe
每个$t$-th subframe中都有$N_p$个相同的训练向量$\bf{v}_t$,这保证了在用户端可以估计(部分的)信道特征。
- 在下行链路中,基于估计的特征,用户会使用多普勒补偿矩阵(Doppler compensation matrix)对多普勒效应作出补偿。在本质上将快速时变信道转换为慢时变有效信道(slow time-arying effective channel)
- 在上行链路中,在每个subframe的头和尾有两种训练向量,该向量是用于在多普勒补偿之后估计慢时变有效通道(slow time-varying effective channel)
上行链路在$t$-thsubframe中优化
下行链路在$(t-1)$-th subframe后优化
$$ \begin{array}{|c|c|c|c|} \hline \text { Notation } & \text { Meaning } & \text { Notation } & \text { Meaning } \ \hline \hline N_{p} & \text { Number of downlink training vectors } & \theta_{T, t, q}\left(\theta_{R, t, q}\right) & \text { The AoD (AoA) of the } q \text {-th path } \ \hline \mathbf{v}{t} & \text { Downlink training vector } & \eta{t} & \text { Rotation angle of user's antenna array } \ \hline M(N) & \text { Number of BS (user) antennas } & \tilde{\theta}{T, m}\left(\tilde{\theta}{R, m}\right) & m \text {-th AoD grid (AoA grid) } \ \hline L_{t} & \text { Number of propagation paths } & \boldsymbol{\beta}{T, t}\left(\boldsymbol{\beta}{R, t}\right) & \text { The AoD(AoA) off-grid vector } \ \hline \alpha_{t, q} & \text { The path gain of the } q \text {-th path } & N_{b} & \text { Number of RF chains at the user } \ \hline f_{d, t} & \text { The maximum DFO } & \tilde{M}(\tilde{N}) & \text { Number of AoD (AoA) grid } \ \hline \end{array} $$
基站和用户都使用半波长间隔ULA
由于系统工作在窄带,所以信道衰落为平稳衰落,用下式表示在$t-th$subframe中$i-th$ symbol的下行信道矩阵2: $$ \boldsymbol{H}{t, i}=\sum{q=1}^{L_{t}} \alpha_{t, q} e^{j 2 \pi f_{d, t} i \cos \left(\theta_{R, t, q}+\eta_{t}\right)} \boldsymbol{a}{R}\left(\theta{R, t, q}\right) \boldsymbol{a}{T}^{H}\left(\theta{T, t, q}\right) $$
rotation angle
由于假设每个subframe内当前symbol所有参数恒定不变,则在后文的表达式中省略所有变量中的$t$ 脚标
接下来分别对AoD和AoD在$ [-\pi / 2, \pi / 2]$上进行$\tilde{M}$和$\tilde{N}$离散化
但是离散化必然会导致量化误差,所以本文提出了3
off-grid basis for the angular domain channel representation
令$\tilde{\theta}{T, m{q}}$和$\tilde{\theta}{R, n{q}}$表示距离真实角度$\theta_{T, q}$和$\theta_{R, q}$最近的离散角度,引入off-grid vector
的概念:$\boldsymbol{\beta}{T}=\left[\beta{T, 1}, \beta_{T, 2}, \ldots, \beta_{T, \tilde{M}}\right]^{T}$该向量满足:
$\beta_{T, m}= \begin{cases}\theta_{T, q}-\tilde{\theta}{T, m{q}}, & m=m_{q}, \quad q=1,2, \ldots, L \ 0, & \text { otherwise }\end{cases}$
$\beta_{R, n}= \begin{cases}\theta_{R, q}-\tilde{\theta}{R, n{q}}, & n=n_{q}, \quad q=1,2, \ldots, L \ 0, & \text { otherwise }\end{cases}$
$q$ 和$m_q$是一一对应的关系,这个关系在刚开始制定量化划分的时候就需要足够密集以保证每个$q$可以分得一个唯一的grid point
本质上来讲off-grid vector 是所有路径的量化误差向量,但并不代表误差,他其实代表了一种定位手段。在这种定位手段假设量化的所有grid point上均有一个对应的传播路径,至于grid point和实际的误差和grid point 上到底有没有传播路径,则是由$\bf{\beta}_T$和${\bf \beta}_R$所描述的
$$ \boldsymbol{A}{R, i}(\boldsymbol{\varphi})=\left[\tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{1}\right), \ldots, \tilde{\boldsymbol{a}}_{R, i}\left(\boldsymbol{\varphi}^{N}\right)\right] \in \mathbb{C}^{N \times N} $$
$$ \boldsymbol{A}{T}\left(\boldsymbol{\beta}{T}\right)=\left[\boldsymbol{a}{T}\left(\tilde{\theta}{T, 1}+\beta_{T, 1}\right), \ldots, \boldsymbol{a}{T}\left(\tilde{\theta}{T, \bar{M}}+\beta_{T, \bar{M}}\right)\right] \in \mathbb{C}^{M \times \bar{M}} $$
$$ \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{n}\right)=\boldsymbol{a}{R}\left(\tilde{\theta}{R, n}+\beta{R, n}\right) \times e^{j 2 \pi f_{d} i \cos \left(\tilde{\theta}{R, n}+\beta{R, n}+\eta\right)} $$
为了可以写成更加紧凑的矩阵形式,定义了矩阵$\tilde{X}$表示对应path的path loss: $$ \tilde{x}{n, m}= \begin{cases}\alpha{q}, & (n, m)=\left(n_{q}, m_{q}\right), \quad q=1,2, \ldots, L \ 0, & \text { otherwise. }\end{cases} $$ 最后的MIMO信道矩阵可以表示为: $$ \boldsymbol{H}{i}\left(\boldsymbol{\varphi}, \boldsymbol{\beta}{T}\right)=\boldsymbol{A}{R, i}(\boldsymbol{\varphi}) \tilde{\boldsymbol{X}} \boldsymbol{A}{T}^{H}\left(\boldsymbol{\beta}_{T}\right) $$ 注意到,以上推导也可以在二维天线阵列中进行推导
以上步骤只是将多径求和换了一种写法,在量化之后就又通过${\bf \beta}_T$和${\bf \beta}_R$ 弥补了量化误差,实际结果和直接写求和是一样的
- mmWave massive MIMO 信道的动态稀疏性(dynamic sparsity)
- 利用用户端多天线阵列的高AoA分辨率
来估计:信道参数、AoA、rotation angle、maximum DFO
-
目的:
- 将高维快速衰落信道转化为低维满衰落信道
-
关键技术:
- 角度域选择性信道跟踪
- 选择性多普勒补偿
- 满衰落信道估计
- 下行训练向量设计
注意以下和索引$t$ 基本无关,将其省略
- 目的
- 估计用于多普勒补偿的信道特征
由于信道模型中的DFO参数和AoA存在一对一的对应关系,而且用户处的大规模天线带来的空间高分辨率可以将不同DFO从不同AoA中分离出来
但是这样的代价是由于BS和用户都使用大规模天线,使得参数维度过高,需要估计的参数有:全角度域信道矩阵${\tilde{X}}$、rotation angle
为了减小信道开销和信道估计性能,本文提出了部分估计信道特征的方法。 $$ \begin{aligned} \boldsymbol{H}{i} \mathbf{v} &=\sum{n=1}^{\bar{N}} \sum_{m=1}^{\bar{M}} \tilde{x}{n, m} \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{n}\right) \boldsymbol{a}{T}^{H}\left(\tilde{\theta}{T, m}+\beta_{T, m}\right) \mathbf{v} \ &=\sum_{n=1}^{\bar{N}} x_{n} \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{n}\right)=\boldsymbol{A}{R, i}(\boldsymbol{\varphi}) \boldsymbol{x} \end{aligned} $$ 最终估计的是部分信道信息:${\boldsymbol \varphi}\ &\ {\boldsymbol x}$
如果每个训练向量都不一样则开销增加$N_q$倍。
在接收端收到的训练向量的信号为: $$ \boldsymbol{y}=\left[\boldsymbol{H}{i} \mathbf{v}+\boldsymbol{n}{i}\right]{i \in \mathcal{N}{p}} $$ 被估计的量:
the estimated partial channel coefficients
$\hat{x}$ ,the AoA off-grid vector
$\hat{\boldsymbol{\beta}}_{R}$ ,rotation angle
$\hat{\eta}$ andmaximum DFO
$\hat{f}_{d}$
利用A中估计得到的$\hat{\boldsymbol{x}}, \hat{\boldsymbol{\beta}}{R}, \hat{\eta} \text { and } \hat{f}{d}$ 对高维快速衰落信道进行降维。
-
在$N$个AoA中选取$N_q$个能量最大的方向,将$\abs{x_n}^2$作为$n-th$ AoA上的信号能量
-
$N_d$ 是用来在空分复用增益和有效CSI信道开销之间作权衡的变量
-
-
由于每一个AoA方向均有一个DFO部分:$e^{j 2 \pi f_{d} i \cos \left(\bar{\theta}{R, n}+\beta{R, n}+\eta\right)}$, 所以,会有DFO的补偿向量
- $\tilde{\boldsymbol{a}}{R, i}^{H}\left(\hat{\boldsymbol{\varphi}}^{n}\right)=\boldsymbol{a}{R}^{H}\left(\tilde{\theta}{R, n}+\hat{\beta}{R, n}\right) \times e^{-j 2 \pi \hat{f}{d} i \cos \left(\bar{\theta}{R, n}+\hat{\beta}_{R, n}+\eta\right)}$
- 选取部分AoA方向:$\mathbf{W}{i}^{d}=\left[\tilde{\boldsymbol{a}}{R, i}\left(\hat{\boldsymbol{\varphi}}^{n}\right)\right]{n \in \mathcal{N}{d}} \in \mathbb{C}^{N \times N_{d}}$
- 转换为慢时变信道:$\boldsymbol{H}{i}^{s}=\left(\mathbf{W}{i}^{d}\right)^{H} \boldsymbol{H}_{i}$
-
${\boldsymbol H}_i^s$ 是经过多普勒补偿之后的信道信息,- 将$\left(\mathbf{W}{i}^{d}\right)^{H}$ 看作是一个列的向量的向量,将$H_i$ 看作是一个整体,并写为$\sum{n=1}^{\tilde{N}} \sum_{m=1}^{\tilde{M}} \tilde{x}{n, m} \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{n}\right) \boldsymbol{a}{T}^{H}\left(\tilde{\theta}{T, m}+\beta_{T, m}\right)$,
- 可以看作是:
$$ \left[\begin{array}{ccccc} {\bf w}{1} \ {\bf w}{2} \ \vdots \ {\bf w}_{N_d} \end{array}\right]\cdot {\boldsymbol H}i= \left[\begin{array}{ccccc} {\bf w}{1} {\boldsymbol H}i \ {\bf w}{2} {\boldsymbol H}i \ \vdots \ {\bf w}{N_d} {\boldsymbol H}_i \end{array}\right] $$
-
$$ \begin{array}{r} \boldsymbol{H}{i}^{s}=\sum{m=1}^{\tilde{M}}\left[\tilde{x}{n, m}+\sum{\tilde{n}=1, \tilde{n} \neq n} \tilde{x}{\tilde{n}, m} \tilde{\boldsymbol{a}}{R, i}^{H}\left(\boldsymbol{\varphi}^{n}\right) \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{\tilde{n}}\right)\right]{n \in \mathcal{N}{d}} \ \times \boldsymbol{a}{T}^{H}\left(\tilde{\theta}{T, m}+\beta{T, m}\right)=\boldsymbol{H}^{s}+\Delta \boldsymbol{H}_{i} \end{array} $$
-
由此就将信道信息分为了慢时变信道和快时变信道:
-
慢时变:$\boldsymbol{H}^{s}=\sum_{m=1}^{\tilde{M}}\left[\tilde{x}{n, m}\right]{n \in \mathcal{N}{d}} \boldsymbol{a}{T}^{H}\left(\theta_{T, m}+\beta_{T, m}\right)$,可以看到和subframe index
$i$ 无关,也就是说该部分在一整个frame中保持恒定。 -
快时变:$\Delta \boldsymbol{H}{i}=\sum{m=1}^{\tilde{M}}\left[\sum_{\tilde{n}=1, \tilde{n} \neq n}^{\tilde{N}} \tilde{x}{\tilde{n}, m} \tilde{\boldsymbol{a}}{R, i}^{H}\left(\boldsymbol{\varphi}^{n}\right) \tilde{\boldsymbol{a}}{R, i}\left(\boldsymbol{\varphi}^{\tilde{n}}\right)\right]{n \in \mathcal{N}{d}}$ $\times \boldsymbol{a}{T}^{H}\left(\theta_{T, m}+\beta_{T, m}\right)$
-
快时变组件$\Delta {\boldsymbol H}_i$的二阶矩(方差)大小是遵从$\mathcal{O}\left(\frac{L}{N^{2}}\right)$ 可以看到:
- 增加接收天线的规模可以使其减小
- 多径增加会使其增大,接收信号更不稳定。
- 当$N$足够大,$\Delta {\boldsymbol H}_i$ 的能量可以被忽略
-
大规模MIMO
- 角度域方法应用了大规模MIMO中的渐变(asymptotical)特性
- 更大规模的接收机天线会带来更高的空间分辨率,从而提取不同AoA中的多普勒特性
- 当$N$足够大,阵列相应中的${\boldsymbol \alpha}_R(\theta)$相互正交,
$\Delta {\boldsymbol H}_i$ 的能量可以被忽略
在经典场景下,基站处的射频链路数量是基站天线数量的$1/2\ \text{or}\ 1/4$ 。因此在上行链路估计中,用户可以$2N_d\ \text{or}\ 4N_d$ 个正交的训练向量(pilots)。这些信号会帮助基站估计信道信息:${\boldsymbol H}_i^s$ 。BS基于估计的${\boldsymbol H}_i^s$ 设计precoding策略,这种策略可以用于both上行和下行。
-
${\boldsymbol H}_i^s$ (这里怀疑是写错了,应该是${\boldsymbol H}^s$)的相关时间比多普勒补偿之后的符号时间(symbol durations)要大得多4 所以每一个frame的时长必须要比${\boldsymbol H}_i^s$的相干时间要短。 - 因此,每个frame可以容纳的symbol数量远远大于$N_d$(有效AoA的数量,代表开销数量级),所以,本文提出的方案是可以在实际系统中所接受的。
具体来讲,该文章引入了一种正交基$\mathbf{B}^{s}=\left[\mathbf{b}{1}^{s}, \ldots, \mathbf{b}{M}^{s}\right] \in \mathbb{C}^{M \times M}$ ,并且写出每个正交基上的能量分布:$\lambda_{m}^{s}=\left|\hat{\boldsymbol{H}}{t-1}^{s} \mathbf{b}{m}^{s}\right|^{2}, \forall m$ 该分布向量$\boldsymbol{\lambda}^{s}=\left[\lambda_{1}^{s}, \ldots, \lambda_{M}^{s}\right]^{T} $的设计原则是尽可能的稀疏。
most promissing channel direction 集合
最后,训练向量被定义为: $$ \begin{aligned} &\mathbf{v}{t} \ &=\frac{\sqrt{\rho}}{\sqrt{N{s}}} \sum_{m \in \mathcal{M}^{}} e^{j \theta_{m}^{s}} \mathbf{b}{m}^{s}+\frac{\sqrt{1-\rho}}{\sqrt{M-N{s}}} \sum_{m \in{1, \ldots, M} \backslash \mathcal{M}^{}} e^{j \theta_{m}^{s}} \mathbf{b}_{m}^{s} \end{aligned} $$ 可以看到,训练向量本质上是方向域正交基底的线性组合,通过在收端进行线性分解就可以获知每个正交方向上的衰落情况,第一部分表示了对于满衰落部分的预测,第二部分则考虑到了下一个frame中会产生新的方向的衰落,所以对于上一时刻中能量集中的方向的剩余进行估计。,在该文中,使用$$ \mu=0.9 \text { and } \rho=0.5
首先,在大规模MIMO中,只有少数的scatter路径被利用,所以说,大规模MIMO信道是稀疏的。另外,${\boldsymbol x}_t$具有时间上的相关性5 。这样的动态稀疏性dynamic sparsity
可以通过三层马尔科夫模型捕获:
信道辅助向量$\boldsymbol{s}_{t} \in{0,1}^{\tilde{N}}$,表示在对应AoA上是否是一个激活信道(active path)。
第二层的随机变量是精度向量$\gamma_{t}=\left[\gamma_{t, 1}, \cdots, \gamma_{t, \tilde{N}}\right]^{T}$ ,其为$x_{t, n}$ 的倒数,则该模型的先验分布(prior distribution),即$\boldsymbol{x}{1: t}, \gamma{1: t}$ and
$p\left(\boldsymbol{x}{\tau} \mid \gamma{\tau}\right)=\prod_{n=1}^{N} p\left(x_{\tau, n} \mid \gamma_{\tau, n}\right)$
$p\left(\gamma_{\tau} \mid s_{\tau}\right)=\prod_{n=1}^{N} \Gamma\left(\gamma_{\tau, n} ; a_{\tau}, b_{\tau}\right)^{s_{\tau, n}} \Gamma\left(\gamma_{\tau, n} ; \bar{a}{\tau}, \bar{b}{\tau}\right)^{1-s_{\tau, n}}$
物理意义上可以理解为激活信道的分布${\boldsymbol s}$ 会导致信道精度${\boldsymbol \gamma}$的差别,信道精度又决定了最终信道特征的分布
伽马超先验(Gamma hyperprior) 这里应该是论文描述不当,这是一个伽马分布(Gamma distribution),$a_{\gamma}, b_{\gamma}$才应该是超参数6 。
原因是当一条path处于active的状态时,其路损会偏离0很大一段距离,此时${\boldsymbol x}{\tau , n}$ 的方差$\gamma{\tau,n}^{-1}$会是一个和0有一段距离的数,即$\Theta(1)$ [^$\Theta(1)$] ,又因为超参数$\alpha_{\tau}, \beta_{\tau}$ 存在关系:${\frac{\alpha_{\tau}}{\beta_{\tau}}}=E[\gamma_{\tau, n}]$,所以在信道激活条件下,两个超参数的比值需要是一个数量级是1的常数。
反之,当信道处于不激活状态时,$x$趋于零,此时要求$\gamma_{\tau,n}^{-1}$趋于零,则${\frac{\alpha_{\tau}}{\beta_{\tau}}}=E[\gamma_{\tau, n}]$ 的选择应当趋于无穷大。
确切的信道特征$x_{\tau}$ 实际上是不知道的,因此我们需要提出一种底复杂度的鲁棒的算法以应对各种不同的信道分布。以上提出的分层信道模型被广泛的应用在稀疏信道的模拟?中7, 8 。
另外,在5中,也提出了信道支撑矢量是慢时变的,同时具有较强的时间相关性,比如说如果$s_{\tau-1}=1$则有很大概率$s_{\tau}=1$。这可以被很自然的建模为一个时间相关的马尔科夫模型: $$ p\left(\boldsymbol{s}{\tau} \mid \boldsymbol{s}{\tau-1}\right)=\prod_{n=1}^{\bar{N}} p\left(s_{\tau, n} \mid s_{\tau-1, n}\right) $$ 对于向量中的每一个元素来讲有:$p\left(s_{\tau, n}=1 \mid s_{\tau-1, n}=\right.0)=\rho_{0,1}, \text { and } p\left(s_{\tau, n}=0 \mid s_{\tau-1, n}=1\right)=\rho_{1,0} $
根据文献9 提出的EM框架,可以很容易的在信道恢复过程中获取$\rho_{0,1},\ \rho_{1,0}$。具体过程在附录A中给出。
在马尔科夫链的起始端,定义其初始概率为一个特定常量:$\lambda \triangleq p\left(s_{1, n}\right)=\frac{\rho_{0,1}}{\rho_{0,1}+\rho_{1,0}}$ 该变量反映了信道的稀疏程度,这样的定义保证了该马尔科夫模型有闭式表达:$p\left(s_{\tau, n}\right)=\lambda^{s_{\tau, n}}(1-\lambda)^{1-s_{\tau, n}}$
在噪声设计中,使用同样的方式,在Gamma函数的参数设计中采用:$p\left(\kappa_{\tau}\right)= \Gamma\left(\kappa_{\tau} ; a_{\kappa, \tau}, b_{\kappa, \tau}\right)$,其中的参数有:$a_{\kappa, \tau}, b_{\kappa, \tau} \rightarrow 0$。下图为$a=0.001,b=0.001$,这样设计的目的是为了实现broad hyperprior
以上提出的模型有较高的自由度,可以通过调节参数来模拟各种各样的场景。更重要的是,本文提出的算法不需要获知这些参数。
该图显示出该三层模型的性质和10中提出的mm-SSCM模型类似
该问题是要根据一些在收端的观测来估计信道中的一些变量:
- 观测(observation):
- 1~t时刻的接受信号$y_{1:t}$
- 1~t-1时刻的角度估计集合$\hat{\varphi}{1: t-1}=\left{\hat{\boldsymbol{\beta}}{R, 1: t-1}, \hat{f}{d, 1: t-1}, \hat{\eta}{1: t-1}\right}$
- 需要估计的量(estimation):
- 部分信道信息(路损)$\boldsymbol{x}_{t}$
- 角度相关信息$\varphi_{t}$
这段估计分为两部分,首先是对于$x_{t}$的估计,本文通过首先假设$\varphi_{t}$已知来估计$x_t$:
$$ p\left(x_{t, n} \mid \boldsymbol{y}{1: t} ; \hat{\boldsymbol{\varphi}}{1: t-1}, \boldsymbol{\varphi}{t}\right) \propto \int{-x_{t, n}} p\left(\boldsymbol{y}{1: t}, \boldsymbol{v}{t} ; \hat{\boldsymbol{\varphi}}{1: t-1}, \boldsymbol{\varphi}{t}\right) $$ 其中$\boldsymbol{v}{t}=\left{\boldsymbol{x}{t}, \boldsymbol{s}{t}, \gamma{t}, \kappa_{t}\right}$(此时为被积分的对象),$-x_{n,t}$表示$x_t$向量中除去$x_{n,t}$的所有元素.之所以这样写,是因为先假设$\hat{\boldsymbol{\varphi}}{1: t-1}, \boldsymbol{\varphi}{t}$是固定的参数,因为如果其值未知,则无法写出$p\left(x_{t, n} \mid \boldsymbol{y}{1: t}\right)$的确切表达式,写在这里对这个公式影响不大,之所以是正比与而不是等于是因为他们之间只差了一个常数的倍数$p({\boldsymbol y}{1:t})$,而该公式的目的只是为了找出使后验概率最大的${\boldsymbol x }_{t}$。
另外,在估计$\hat{\boldsymbol{\varphi}}{t}$时,使用最大似然估计(ML): $$ \begin{aligned} \hat{\varphi} &=\arg \max {\varphi{t}} \ln p\left(\boldsymbol{y}{1: t} ; \hat{\boldsymbol{\varphi}}{1: t-1}, \boldsymbol{\varphi}{t}\right) \ &=\arg \max {\boldsymbol{\varphi}{t}} \ln \int_{\boldsymbol{v}{t}} p\left(\boldsymbol{y}{1: t}, \boldsymbol{v}{t} ; \hat{\boldsymbol{\varphi}}{1: t-1}, \boldsymbol{\varphi}{t}\right) d \boldsymbol{v}{t} \end{aligned} $$ 在文章中首先写了如何估计$x_{t}$然后再写了如何估计$\hat{\boldsymbol{\varphi}}_{t}$,~~但是实际算法中的情况却是应该反过来。~~理解错误,这里决定y的值的不仅是$\varphi$还有x
以上算法的难点在于,估计$x_{t}$时,公式中的因子图(factor graph)11含有循环,所以通过DD-VBI算法近似求解边界后验概率。并且采用MM算法(majorization-minimization)(是一种普遍的EM算法)3
简单的联合估计$\boldsymbol{x}{t}$和$ \boldsymbol{\varphi}{t}$ 所带来的时间复杂度是无法接受的,因此,首先需要对变量进行解耦:
- 第$t$时刻相关的
- 之前$t-1$时刻之前的所有信息(message passing12)
$$ \begin{aligned} &p\left(\boldsymbol{y}{1: t}, \boldsymbol{v}{t} ; \hat{\varphi}{1: t-1}, \boldsymbol{\varphi}{t}\right) \ &\quad \propto \sum_{s_{t-1}} p\left(\boldsymbol{s}{t-1} \mid \boldsymbol{y}{1: t-1} ; \hat{\varphi}{1: t-1}\right) p\left(\boldsymbol{s}{t} \mid \boldsymbol{s}{t-1}\right) \ &p \begin{array}{l} \left.\boldsymbol{y}{t} \mid \boldsymbol{x}{t}, \kappa{t} ; \boldsymbol{\varphi}{t}\right) p\left(\boldsymbol{x}{t} \mid \boldsymbol{\gamma}{t}\right) p\left(\boldsymbol{\gamma}{t} \mid \boldsymbol{s}{t}\right) p\left(\kappa{t}\right) \ & \approx \sum_{s_{t-1}} q\left(\boldsymbol{s}{t-1} \mid \boldsymbol{y}{1: t-1} ; \hat{\boldsymbol{\varphi}}{1: t-1}\right) p\left(\boldsymbol{s}{t} \mid \boldsymbol{s}{t-1}\right) \ p\left(\boldsymbol{y}{t} \mid \boldsymbol{x}{t}, \kappa{t} ; \boldsymbol{\varphi}{t}\right) p\left(\boldsymbol{x}{t} \mid \boldsymbol{\gamma}{t}\right) p\left(\boldsymbol{\gamma}{t} \mid \boldsymbol{s}{t}\right) p\left(\kappa{t}\right) \ & =\hat{p}\left(\boldsymbol{s}{t} \mid \boldsymbol{y}{1: t-1} ; \hat{\varphi}{1: t-1}\right) p\left(\boldsymbol{y}{t} \mid \boldsymbol{x}{t}, \kappa{t} ; \boldsymbol{\varphi}{t}\right) \ p\left(\boldsymbol{x}{t} \mid \boldsymbol{\gamma}{t}\right) p\left(\boldsymbol{\gamma}{t} \mid \boldsymbol{s}{t}\right) p\left(\kappa{t}\right), \end{array} \end{aligned} $$
在维基百科中,Gamma分布是一种由两个参数定义的连续随机变量分布密度,指数分布、Erlang分布、chi-square分布都是Gamma分布的特殊状态。一般有两种主流的Gamma分布的定义方法:
- shape parameter
$k$ ,和 scale parameter$\theta$ - shape parameter
$\alpha = k$ , 和rate parameter$\beta = \theta^{-1}$
$f(x ; \alpha, \beta)=\frac{\beta^{\alpha} x^{\alpha-1} e^{-\beta x}}{\Gamma(\alpha)} \quad$ for$x>0 \quad \alpha, \beta>0$ 本文中应用的是第二种定义方式
Variational Bayesian methods are a family of techniques for approximating intractable integrals arising in Bayesian inference and machine learning. They are typically used in complex statistical models consisting of observed variables (usually termed "data") as well as unknown parameters and latent variables, with various sorts of relationships among the three types of random variables, as might be described by a graphical model. As typical in Bayesian inference, the parameters and latent variables are grouped together as "unobserved variables". Variational Bayesian methods are primarily used for two purposes:
MIMO具有定位的潜力,但是在mmave信道中由于存在多径效应,无法准确估计AoA。
本文提出了一种基于压缩感知的算法。
因为MIMO的天线数量规模较大,所以角度分辨率较高,于是有潜力分别估计各个AoA到达的角度[12,13]尽管如此,基站还是需要估计出LOS路径的AoA[14,15,16],但是LoS链路并不总是能量最大的链路,于是[17] 提出了综合分析各个AoA的数据进行融合分析,但是这是一个NP-hard问题三
two step
direct localization approach
本文使用技术:
- match filter[28]
- coarse TOA estimate[self]
- grid refinement procedure[29]
$$ \begin{aligned} &\tau_{l}(\mathbf{p})=\left|\mathbf{p}-\tilde{\mathbf{p}}{l}\right| / c \ &\theta{l}(\mathbf{p})=\arctan \left(\frac{p^{y}-\tilde{p}{l}^{y}}{p^{x}-\tilde{p}{l}^{x}}\right)+\pi \cdot \mathbb{1}\left(p^{x}<\tilde{p}_{l}^{x}\right) \end{aligned} $$
和别的工作不同,该文章从匹配滤波器的角度出发研究接收信号表达形式
$$
\begin{aligned}
\mathbf{z}{l}^{\mathrm{MF}}(t)=& \int{0}^{T_{\mathrm{obs}}} s^{*}(\tau-t) \mathbf{z}{l}(\tau) \mathrm{d} \tau \
=& \alpha{l} r_{s}\left(t-\tau_{l}(\mathbf{p})\right) \mathbf{a}{l}\left(\theta{l}(\mathbf{p})\right) \
&+\sum_{m=1}^{P_{l}} \alpha_{l}^{m} r_{s}\left(t-\tau_{l}^{m}\right) \mathbf{a}{l}\left(\theta{l}^{m}\right)+\mathbf{n}{l}^{\mathrm{MF}}(t)
\end{aligned}
$$
and sampling at time $t{l}$,
$$
\overline{\mathbf{z}}{l}=\mathbf{z}{l}^{\mathrm{MF}}\left(t_{l}\right)=\bar{\alpha}{l} \mathbf{a}{l}\left(\theta_{l}(\mathbf{p})\right)+\sum_{m=1}^{P_{l}} \bar{\alpha}{l}^{m} \mathbf{a}{l}\left(\theta_{l}^{m}\right)+\overline{\mathbf{n}}{l}
$$
where $\bar{\alpha}{l}=r_{s}\left(t_{l}-\tau_{l}(\mathbf{p})\right) \alpha_{l}, \bar{\alpha}{l}^{m}=r{s}\left(t_{l}-\tau_{l}^{m}\right) \alpha_{l}^{m}$ and $\overline{\mathbf{n}}{l} \sim$ $\mathcal{C} \mathcal{N}\left(\mathbf{0}, \sigma^{2} \mathbf{I}\right)$ where $\sigma^{2}=N{0}$ because, without loss of generalization, the pulse energy is normalized to one
In order to ensure that $\bar{\alpha}{l} \neq 0$, the signals must be sampled at a time where the energy of the LOS pulse is not zero (i.e. while $\left.r{s}\left(t_{l}-\tau_{l}(\mathbf{p})\right) \neq 0\right)$. In addition to the sampling times, we will also compute an upper bound on the TOA of the LOS paths at each base station that will enhance the proposed method, which for brevity are simply called TOA estimates. In a nutshell, the objective of our work is to determine the sampling times and the TOA estimates from $\left{\mathbf{z}{l}^{\mathrm{MF}}(t)\right}{l=1}^{L}$, and then, determine
$$ \mathbf{Y}{p} \triangleq \mathbf{H}^{r} D{p}(\boldsymbol{\Phi}) \mathbf{H}^{s} \mathbf{X}+\mathbf{W}_{p} $$
$$ [\mathbf{X}]{i, j, k} \triangleq \sum{r=1}^{R}[\mathbf{A}]{i, r}[\mathbf{B}]{j, r}[\mathbf{C}]_{k, r} $$
这样一个三维矩阵的二维切片为: $$ \begin{aligned} &\mathbf{X}{i,:,:}=\mathbf{B} \operatorname{diag}\left([\mathbf{A}]{i,:}\right) \mathbf{C}^{T}, \quad i=1,2, \ldots, I \ &\mathbf{X}{:, j,:}=\mathbf{C} \operatorname{diag}\left([\mathbf{B}]{j,:}\right) \mathbf{A}^{T}, \quad j=1,2, \ldots, J \ &\mathbf{X}{:,, k}=\mathbf{A} \operatorname{diag}\left([\mathbf{C}]{k,:}\right) \mathbf{B}^{T}, \quad k=1,2, \ldots, K \end{aligned} $$
$$ \widetilde{\mathbf{Z}}{p} \triangleq \mathbf{Y}{p} \mathbf{X}^{H}=\underbrace{\mathbf{H}^{r} D_{p}(\boldsymbol{\Phi}) \mathbf{H}^{s}}{\triangleq \mathbf{z}{p}}+\widetilde{\mathbf{W}}_{p} $$
Mode-1:
Footnotes
-
G. Liu, A. Liu, R. Zhang and M. Zhao, "Angular-Domain Selective Channel Tracking and Doppler Compensation for High-Mobility mmWave Massive MIMO," in IEEE Transactions on Wireless Communications, vol. 20, no. 5, pp. 2902-2916, May 2021, doi: 10.1109/TWC.2020.3045272. ↩
-
W. U. Bajwa, J. Haupt, A. M. Sayeed, and R. Nowak, “Compressed channel sensing: A new approach to estimating sparse multipath chan�nels,” Proc. IEEE, vol. 98, no. 6, pp. 1058–1076, Jun. 2010. ↩
-
J. Dai, A. Liu, and V. K. N. Lau, “FDD massive MIMO channel esti�mation with arbitrary 2D-array geometry,” IEEE Trans. Signal Process., vol. 66, no. 10, pp. 2584–2599, May 2018. ↩ ↩2
-
W. Guo, W. Zhang, P. Mu, F. Gao, and H. Lin, “High-mobility wide�band massive MIMO communications: Doppler compensation, analysis and scaling laws,” IEEE Trans. Wireless Commun., vol. 18, no. 6, pp. 3177–3191, Jun. 2019 ↩
-
X. Zhu, L. Dai, G. Gui, W. Dai, Z. Wang, and F. Adachi, “Structured matching pursuit for reconstruction of dynamic sparse channels,” in Proc. IEEE Global Commun. Conf. (GLOBECOM), Dec. 2015, pp. 1–5 ↩ ↩2
-
D. G. Tzikas, A. C. Likas, and N. P. Galatsanos, “The variational approximation for Bayesian inference,” IEEE Signal Process. Mag., vol. 25, no. 6, pp. 131–146, Jan. 2008. ↩ ↩2
-
D. G. Tzikas, A. C. Likas, and N. P. Galatsanos, “The variational approximation for Bayesian inference,” IEEE Signal Process. Mag., vol. 25, no. 6, pp. 131–146, Jan. 2008. ↩ ↩2
-
J. Ziniel and P. Schniter, “Dynamic compressive sensing of time-varying signals via approximate message passing,” IEEE Trans. Signal Process.,vol. 61, no. 21, pp. 5270–5284, Jul. 2013. ↩
-
M. K. Samimi and T. S. Rappaport, “3-D millimeter-wave statistical channel model for 5G wireless system design,” IEEE Trans. Microw.Theory Tech., vol. 64, no. 7, pp. 1–19, Jul. 2016. ↩
-
https://blog.csdn.net/qq_41603411/article/details/105209622 ↩