「HNOI2019」白兔之舞

2019 年 4 月 8 日

有一张顶点数为 $(L+1)\times n$ 的有向图。这张图的每个顶点由一个二元组 $(u,v)$ 表示 $(0\le u\le L,1\le v\le n)$ 。这张图不是简单图，对于任意两个顶点 $(u_1,v_1)(u_2,v_2)$ ，如果 $u_1<u_2$ ，则从 $(u_1,v_1)$ 到 $(u_2,v_2)$ 一共有 $w[v_1][v_2]$ 条不同的边，如果 $u_1\ge u_2$ 则没有边。

白兔将在这张图上上演一支舞曲。白兔初始时位于该有向图的顶点 $(0,x)$ 。

白兔将会跳若干步。每一步，白兔会从当前顶点沿任意一条出边跳到下一个顶点。白兔可以在任意时候停止跳舞（也可以没有跳就直接结束）。当到达第一维为 $L$ 的顶点就不得不停止，因为该顶点没有出边。

假设白兔停止时，跳了 $m$ 步，白兔会把这只舞曲给记录下来成为一个序列。序列的第 $i$ 个元素为它第 $i$ 步经过的边。

问题来了：给定正整数 $k$ 和 $y$ （ $1\le y\le n$ ），对于每个 $t$ （ $0\le t<k$ ），求有多少种舞曲（假设其长度为 $m$ ）满足 $m \bmod k=t$ ，且白兔最后停在了坐标第二维为 $y$ 的顶点？

两支舞曲不同定义为它们的长度（ $m$ ）不同或者存在某一步它们所走的边不同。

$1 \leq n \leq 3,\ 1 \leq k \leq 65536,\ 10^8 \leq p \leq 2^{30}$ 。

题解

对于 $n=1$ 的情况，考虑令 $a = w_{1, 1}$ ，用 $f_i$ 表示跳了 $i$ 步的答案，则 $f_i = a^i \binom n i$ 。

考虑

\begin{aligned} ans &= \sum_{i \bmod k=m} f_i = \sum_{i \bmod k=m} a^i \binom ni \\ &= \sum_{i=0}^n [k|i-m] a^i \binom ni \\ &= \sum_{i=0}^n \frac 1k \sum_{j=0}^{k-1} \omega_k^{j(i-m)} a^i \binom ni \\ &= \frac 1k \sum_{j=0}^{k-1} \omega^{-mj}_k \sum_{i=0}^n \binom ni (\omega^{j}_k a)^i 1^{n-i} \\ &= \frac 1k \sum_{i=0}^{k-1} \omega^{-mi}_k \left(\omega^i_k a + 1\right)^n \end{aligned}

考虑后面的 $\displaystyle{\left(\omega^i_k a + 1\right)^n}$ 对于固定的 $i$ 是相同的，可以与先处理出 $i \in [0, k)$ 的值，设为 $c(i)$ 。

一个暴力是多项式多点求值出多项式 $\displaystyle{\frac 1k \sum_{i=0}^{k-1} x^i c(i)}$ 在 $\omega_k^0, \omega_k^{-1}, \omega_k^{-2} ... \omega_k^{-k+1}$ 的值，复杂度 $O(k \log^2 k)$ ，有学长写了一发，貌似被针对了过不去 ...

考虑是否有更优秀的做法来处理 $\omega^{-mj}$ ？毛爷爷论文中提到把 $ij$ 拆成 $\frac {(i+j)^2} 2 - \frac {i^2} 2 - \frac {j^2} 2$ ，然而可能存在单位根没有二次剩余的情况。考虑把 $ij$ 拆成 $\binom {i+j} 2 - \binom i2 - \binom j2$ ，那么原式可以化为

\begin{aligned} ans &= \frac 1k \sum_{i=0}^{k-1} \omega^{-mi}_k c(i) \\ &= \frac 1k \sum_{i=0}^{k-1} \omega^{\binom {i-m} 2 - \binom i2 - \binom {-m}2} _k c(i) \\ &= \frac {\omega^{- \binom {-m}2}} k \sum_{i=0}^{k-1} \omega^{\binom {i-m} 2}_k \left( \omega^{- \binom i2}_k c(i)\right) \\ \end{aligned}

是一个卷积的形式，复杂度 $O(k \log k)$ 。

考虑 $n \le 3$ 的情况，原来的转移会变成矩阵，类似于 BZOJ3328 PYXFIB，可以发现 $c(i)$ 仍然是一个常数，同理卷积即可。

代码

#include <bits/stdc++.h>
using namespace std;
using poly = vector<int>;
const int N = 7e4 + 9;
int n, k, L, x, y, mod, c[N], w[N], ans[N];
poly f, g;
inline int dec(int a, int b) {
  a -= b;
  return a < 0 ? a + mod : a;
}
inline int sub(int a, int b) {
  a += b;
  return a >= mod ? a - mod : a;
}
inline int mul(int a, int b) { return (long long)a * b - (long long)a * b / mod * mod; }
inline int inv(int x) { return x < 2 ? 1 : mul(mod - mod / x, inv(mod % x)); }
template <class T> inline int get_omega(T x) {
  x = x % k;
  return w[x < 0 ? x + k : x];
}
inline int fpow(int a, int b) {
  int s = 1;
  for (; b; b >>= 1, a = mul(a, a))
    if (b & 1) s = mul(s, a);
  return s;
}
int get_root(int p) {
  int phi = 1, tmp = p;
  for (int i = 2; i * i <= tmp; i++)
    if (tmp % i == 0) {
      phi *= i - 1, tmp /= i;
      while (tmp % i == 0) phi *= i, tmp /= i;
    }
  if (tmp != 1) phi *= tmp - 1;
  vector<int> e(1, 1);
  for (int i = 2; i * i <= phi; i++)
    if (phi % i == 0) {
      e.push_back(i);
      if (i * i != phi) e.push_back(phi / i);
    }
  for (int w = 2;; w++) {
    bool flag = true;
    for (int x : e)
      if (fpow(w, x) == 1) {
        flag = false;
        break;
      }
    if (flag) return w;
  }
}
struct matrix {
  int a[3][3];
  friend inline matrix operator+(matrix a, const matrix &b) {
    for (int i = 0; i < 3; i++)
      for (int j = 0; j < 3; j++) a.a[i][j] = sub(a.a[i][j], b.a[i][j]);
    return a;
  }
  friend inline matrix operator*(matrix a, int b) {
    for (int i = 0; i < 3; i++)
      for (int j = 0; j < 3; j++) a.a[i][j] = mul(a.a[i][j], b);
    return a;
  }
  friend inline matrix operator*(const matrix &a, const matrix &b) {
    matrix c;
    memset(c.a, 0, sizeof(c.a));
    for (int i = 0; i < 3; i++)
      for (int j = 0; j < 3; j++)
        for (int k = 0; k < 3; k++) c.a[i][j] = (c.a[i][j] + (long long)a.a[i][k] * b.a[k][j]) % mod;
    return c;
  }
  friend inline matrix fpow(matrix a, int b) {
    matrix s;
    memset(s.a, 0, sizeof(s.a)), s.a[0][0] = s.a[1][1] = s.a[2][2] = 1;
    for (; b; b >>= 1, a = a * a)
      if (b & 1) s = s * a;
    return s;
  }
} I, S, A;
namespace MTT {
const int M = N << 2;
const double pi = acos(-1);
long long p30 = 1ll << 30, p15 = 1ll << 15;
struct complex {
  double a, b;
  inline complex() {}
  inline complex(double x) { a = x, b = 0; }
  inline complex(double x, double y) { a = x, b = y; }
  inline complex operator+(const complex &other) const { return complex(a + other.a, b + other.b); }
  inline complex operator-(const complex &other) const { return complex(a - other.a, b - other.b); }
  inline complex operator*(const complex &other) const { return complex(a * other.a - b * other.b, a * other.b + b * other.a); }
} w[M], iw[M], a[M], b[M], c[M], d[M], e[M], f[M], g[M], h[M];
int lim, rev[M];
inline int init(int len) {
  int lim = 1, k = 0;
  while (lim < len) lim <<= 1, ++k;
  for (int i = 0; i < lim; i++) rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (k - 1));
  len = lim >> 1;
  for (int i = 0; i < len; i++) w[i + len] = complex(cos(pi * i / len), sin(pi * i / len));
  for (int i = 0; i < len; i++) iw[i + len] = complex(cos(pi * i / len), -sin(pi * i / len));
  for (int i = len - 1; i >= 0; i--) w[i] = w[i << 1], iw[i] = iw[i << 1];
  return lim;
}
inline void fft(complex *a) {
  for (int i = 0; i < lim; i++)
    if (i < rev[i]) swap(a[i], a[rev[i]]);
  for (int len = 1; len < lim; len <<= 1)
    for (int i = 0; i < lim; i += (len << 1))
      for (int j = 0; j < len; j++) {
        complex x = a[i + j], y = a[i + j + len] * w[j + len];
        a[i + j] = x + y, a[i + j + len] = x - y;
      }
}
inline void ifft(complex *a) {
  for (int i = 0; i < lim; i++)
    if (i < rev[i]) swap(a[i], a[rev[i]]);
  for (int len = 1; len < lim; len <<= 1)
    for (int i = 0; i < lim; i += (len << 1))
      for (int j = 0; j < len; j++) {
        complex x = a[i + j], y = a[i + j + len] * iw[j + len];
        a[i + j] = x + y, a[i + j + len] = x - y;
      }
  for (int i = 0; i < lim; i++) a[i].a /= lim;
}
inline poly operator*(const poly &F, const poly &G) {
  poly H(F.size() + G.size() - 1);
  lim = init(H.size());
  for (int i = 0; i < F.size(); i++) a[i] = F[i] >> 15, b[i] = F[i] & 32767;
  for (int i = 0; i < G.size(); i++) c[i] = G[i] >> 15, d[i] = G[i] & 32767;
  for (int i = F.size(); i < lim; i++) a[i] = b[i] = 0;
  for (int i = G.size(); i < lim; i++) c[i] = d[i] = 0;
  fft(a), fft(b), fft(c), fft(d);
  for (int i = 0; i < lim; i++) {
    e[i] = a[i] * c[i];
    f[i] = a[i] * d[i];
    g[i] = b[i] * c[i];
    h[i] = b[i] * d[i];
  }
  ifft(e), ifft(f), ifft(g), ifft(h);
  p30 %= mod, p15 %= mod;
  for (int i = 0; i < H.size(); i++) {
    long long tmp = 0;
    tmp += (long long)(e[i].a + 0.5) % mod * p30 % mod;
    tmp += (long long)(f[i].a + 0.5) % mod * p15 % mod;
    tmp += (long long)(g[i].a + 0.5) % mod * p15 % mod;
    tmp += (h[i].a + 0.5);
    H[i] = tmp % mod;
  }
  return H;
}
} // namespace MTT
using MTT::operator*;
int main() {
#ifdef memset0
  freopen("1.in", "r", stdin);
#endif
  cin.tie(0)->sync_with_stdio(0);
  cin >> n >> k >> L >> x >> y >> mod, --x, --y;
  for (int i = 0; i < n; i++)
    for (int j = 0; j < n; j++) {
      cin >> A.a[i][j];
    }
  w[0] = 1, w[1] = fpow(get_root(mod), (mod - 1) / k);
  for (int i = 2; i < k; i++) w[i] = mul(w[i - 1], w[1]);
  I.a[0][0] = I.a[1][1] = I.a[2][2] = 1, S.a[0][x] = 1;
  for (int i = 0; i < k; i++) c[i] = (S * fpow(A * w[i] + I, L)).a[0][y];
  f.resize((k << 1) + 1), g.resize(k + 1);
  for (int i = 0; i < f.size(); i++) f[i] = get_omega(-((long long)i * (i - 1) >> 1));
  for (int i = 0; i < g.size(); i++) g[i] = mul(c[i], get_omega(((long long)i * (i - 1) >> 1)));
  reverse(g.begin(), g.end());
  f = f * g;
  int inv_k = inv(k);
  for (int i = 0; i < k; i++) ans[i] = mul(f[k + i], mul(get_omega(((long long)i * (i - 1) >> 1)), inv_k));
  for (int i = 0; i < k; i++) cout << ans[i] << '\n';
}

题解

代码

评论