Заметки о теоретической физике → 2013 → 11
Михаил Гойхман

Голографическая перенормировка С.-С. Ли

14 ноября 2013 года, 18:21

Вчера обсуждали на семинаре вот эту статью:

Sung-Sik Lee, Quantum Renormalization Group and Holography

У меня есть несколько личных комментариев касательно всего подхода, который выдвигается в этой статье.

Для начала, о чем собственно статья. Допустим у вас есть взаимодействующая квантовая теория поля. Тогда теория перенормируется. При движении из ультрафиолетового режима в инфракрасный режим осуществляется перенормировка констант связи и размерностей операторов. В инфракрасном режиме появляются новые операторы. Т.е. эффективный лагранжиан теории при низких энергиях содержит члены взаимодействия, которые отсутствовали в изначальном ультрафиолетовом лагранжиане.

С.-С. Ли хочет описать этот ренорм-групповой поток в наиболее общем виде при помощи теории гравитации в пятимерном пространстве. Разумеется, его идея основывается на AdS/CFT соответсвии и голографической перенормировке, хотя в статье вы найдете мало ссылок на методику AdS/CFT. Так или иначе, идея статьи — описать ренорм-групповой поток с помощью классической гравитации. Это полезная цель, в некотором смысле, так как ренорм-групповой поток в большей части непертурбативен и (в несуперсимметричных теориях) затруднительно много про него сказать точно.

Однако, на мой взгляд, вся идеология статьи ошибочна по ряду причин.

1. Правильный способ описать голографическую перенормировку — это использовать AdS/CFT соответствие. Ясно, что AdS/CFT соответствие описывает РГ поток в КТП с помощью классических уравнений гравитации, и потому фактически решает задачу, поставленную С.-С. Ли. Однако, есть ограничения. AdS/CFT утверждает что вы можете описывать теорию поля с помощью теории гравитации в AdS только если теория поля берется при большой константе взаимодействия тХуфта. Строго говоря — бесконечно большой. Любая конечная константа взаимодействия означает что вы должны учесть струнные поправки в AdS. Константа взаимодействия, равная 1, по порядку величины, означает что теория супрегравитации полностью неверна (вообще говоря), и нужно использовать всю теорию струн. Это элементарное AdS/CFT.

С другой стороны, калибровочная теория поля в УФ (при достаточно большом ранке калибровочной группы), скажем, КХД, свободна в УФ. Т.е. константа взаимодействия там равна нулю. Так что ультрафиолетовый режим никогда не будет описываться гравитацией в AdS. Гравитация в AdS описывает только, в лучшем случае, ИК фазу и ее окрестность.

2. Как собственно работает голографическая перенормировка в AdS/CFT? Допустим, несмотря на то что написано в предыдущем пункте, вы хотите описать весь РГ поток из УФ в ИК только с помощью теории гравитации, без использования теории струн. Это можно сделать. Чтобы это сделать вы берете конформную теорию поля при большой константе тХуфта. Такая теория дуальна теории гравитации в AdS пространстве. Т.к. теория поля конформна, она никуда не течет.

Так что вы добавляете к ней, скажем, двухследовое возмущение. Такая пертурбация включает ренормгрупповой поток, выведя теорию из критической (конформной) точки. При определенных значениях параметров теории однако включенный ренорм-групповой поток остановится в новой критической точке. Теория перетечет из одного конформного режима в другой.

Важно заметить что константа связи тХуфта в этом рассмотрении остается постоянной, не перенормируется. Перенормируется только константа двухследового взаимодействия, которое мы включили, и, возможно, все остальные константы мультиследовых взаимодействий. Принципиально важно что (односледовая) константа тХуфта всегда остается большой, и потому теория гравитации всегда остается верной. У С.С. Ли это не так, поэтому его теория поля не описывается гравитацией, а должна описываться теорией струн.

3. Классическая гравитация в AdS описывает сильную теорию поля только если теория поля берется при большом ранке калибровочной группы. Любой конечный ранк означает что гравитация в AdS должна быть квантовой. Единственная правильная квантовая теория гравитации — это теория струн, со всеми дополнительными степенями свободы, которые она приносит. С.С. Ли должен рассматривать теорию струн в AdS, если он хочет чтобы его конструкции работали.

4. Опять, рассмотрим КХД. В ультрафиолете КХД — это совсем другая теория чем КХД в ИК. В УФ КХД описывается лагранжианом СМ. Динамическими полями являются кварки и глюоны. В ИК нет кварков и глюонов, но есть мезоны, барионы, глюболы и т.д. — в силу конфайнмента ИК фаза полностью отлична от УФ фазы. Даже если предположить что С.С. Ли может ловко переключиться на описание совершенно новых степеней свободы в ИК чем в УФ (сомневаюсь), его конструкция все равно имеет принципиальную трудность.

Дело в том, что КХД обладает бесконечным числом мезонов с высшими спинами. Поэтому, собственно, AdS/QCD, где в AdS у вас теория супергравитации, никогда не сможет описать КХД. Просто потому что супергравитация в AdS не содержит полей со спином выше чем 2, и потому никогда не сможет описать мезоны с высшими спинами.

5. Резюмируя, нужно быть более аккуратным в том что такое голографическая перенормировка. Ясно, что пространство AdS дуально конформной теории поля, которая не перенормируется. Пространство, которое только асимптотически является AdS, может описывать РГ поток, так что радиальная координата AdS соответсвует масштабу энергии теории поля. Например, AdS-солитон — пространство, которое асимптотически AdS с «двух сторон» — вблизи границы и горизонта Пуанкаре. Такое пространство описывает поток из одной конформной теории поля (в УФ) в другую конформную теорию поля (в ИК).

Однако, не всякое пространство, которое асимпотически AdS, описывает РГ поток. Скажем, (заряженная) черная дыра в AdS не описывает РГ поток. Она описывает конформную теорию поля в которой включена температура (и добавлен заряд). Она описывает одну фиксированную точку РГ потока, а не весь поток! Пространство AdS с ИК стенкой тоже не описывает РГ поток. Оно описывает ИК фазу КХД с нарушенной конформной симметрией.

6. Ренорм-групповой поток — это квантовое свойство теории поля. В классической теории поля все диаграммы — древесные, петель с виртуальными частицами нет, так что теория не перенормируется. Я сильно подозреваю, что подход Малдасены-Сасскинда для описания квантовых свойств теории поля с помощью голографически-дуальной классической теории значительно более полезен чем подход С.С. Ли. Как, скажем, в этой статье описывается запутанная пара квар-анти-кварк в рамках AdS/CFT соответствия.

Ключевые слова: AdS/CFT, квантовая теория поля | Оставить комментарий
Роман Парпалак

Метод наименьших квадратов во многомерном пространстве

17 ноября 2013 года, 17:35

Я собираюсь применить метод наименьших квадратов для проведения гиперплоскости через набор точек во многомерном пространстве. Для начала вспомним суть метода и поймем, в чем состоит задача.

В простейшем случае метод наименьших квадратов применяется для проведения прямой линии через набор экспериментальных точек и состоит в минимизации суммы квадратов отклонений $$\inline\sum(y_i-ax_i-b)^2$$, которые списываются на погрешность измерений. В результате минимизации для коэффициентов a и b получается простая система линейных уравнений. Здесь важно предположение о том, что ошибки по оси x пренебрежимо малы по сравнению с ошибками по оси y. Если это не так, то минимизировать нужно более сложное выражение.

Иногда возникает задача другого рода — провести геометрическую прямую через набор геометрических точек «наилучшим образом». Для этой задачи метод наименьших квадратов нужно адаптировать, так как поспешное применение формул для коэффициентов a и b будет давать разные прямые в разных системах координат. Теперь отклонения по осям должны быть одинаковы. Правильный подход заключается в минимизации суммы квадратов расстояний $$\inline\sum(y_i-ax_i-b)^2/(1+a^2)$$ от точек (xi, yi) до проводимой прямой. Он дает нелинейную систему уравнений, которую можно решать численно. Однако этот подход тяжело обобщается на интересующий меня многомерный случай. Поэтому мы с самого начала будем рассматривать задачу во многомерном пространстве.

Задача

Пусть задан набор точек $$\vec{x}^k$$. Мы хотим провести гиперплоскость $$(\vec{n}\cdot\vec{x}) = d$$ такую, что сумма квадратов расстояний от точек $$\vec{x}^k$$ до нее будет минимальна. Расстояние до гиперплоскости находится с помощью проекции на единичный вектор нормали $$\vec{n}$$, и выражение для минимизации принимает вид

$$\sum_k\left((\vec{n}\cdot\vec{x}^k)-d\right)^2\to\text{min}.$$

При этом нужно учитывать уравнение связи $$(\vec{n}\cdot\vec{n}) = 1$$, которое уменьшает на 1 количество степеней свободы в неизвестных величинах ni, d. Учет связи выполняется с помощью метода множителей Лагранжа. Однако мы пойдем другим путем, который сократит выкладки и напрямую приведет к выражениям, подходящим для численного счета. Мы разрешим вектору $$\vec{n}$$ иметь произвольную длину, и введем явную нормировку:

$$\sum_k\left({(\vec{n}\cdot\vec{x}^k)\over|\vec{n}|}-d\right)^2\to\text{min}.$$

Параллельный перенос

Продифференцируем по d:

$$\sum_k\left({(\vec{n}\cdot\vec{x}^k)\over|\vec{n}|}-d\right)={(\vec{n}\cdot\sum_k\vec{x}^k)\over|\vec{n}|}-\sum_kd=0.$$

Как видим, «центр масс» набора точек $$\inline\sum\vec{x}^k/\sum 1$$ находится на искомой плоскости. Выполним параллельный перенос системы координат таким образом, чтобы ее начало совпало с центром набора точек $$\inline\sum\vec{x}^k=0$$. В этой системе координат d=0.

Условие на вектор нормали

Перейдем к индексным обозначениям и продифференцируем по na:

$${\partial\over\partial n_a}\left({n_ix_i^k\,n_jx_j^k\over n_ln_l}\right)={2x_a^k\,n_jx_j^k\over n_ln_l}-{2n_a\,n_ix_i^k\,n_jx_j^k\over n_ln_l\,n_pn_p}=0,$$

$$n_jx_j^k\left[x_a^k(n_pn_p)-n_a(n_ix_i^k)\right]=0,$$

$$\sum_k\vec{n}\cdot\vec{x}^k\left[\vec{x}^k(\vec{n}\cdot\vec{n})-\vec{n}(\vec{n}\cdot\vec{x}^k)\right]=0.$$

Вычислительный аспект

Нелинейное уравнение относительно вектора $$\vec{n}$$ можно решать методом итераций:

$$\sum_k\vec{n}_{i+1}\cdot\vec{x}^k\left[\vec{x}^k(\vec{n}_i\cdot\vec{n}_i)-\vec{n}_i(\vec{n}_i\cdot\vec{x}^k)\right]=0.$$

С помощью матрицы $$A_{aj}(\vec{n})=\left[x_a^k(n_pn_p)-n_a(n_ix_i^k)\right]x_j^k$$ оно представляется в виде

$$A(\vec{n}_i)\,\vec{n}_{i+1}=0$$

и сводится к поиску ядра линейного оператора. Нетривиальность ядра связана с «лишней» степенью свободы, появившейся из-за отбрасывания условия нормировки вектора нормали. Читатели могут самостоятельно проверить с помощью формулы Бине — Коши, что определитель матрицы $$A(\vec{n}_i)$$ равен нулю.

По теореме Фредгольма ядро оператора ортогонально образу сопряженного оператора, то есть линейной оболочке, натянутой на строки $$\vec{a}_a$$ матрицы $$A_{aj}(\vec{n}_i)$$. Алгоритм поиска ортогонального дополнения состоит в выборе произвольного вектора $$\vec{r}$$ и ортогонализации набора векторов $$\vec{r}, \vec{a}_a$$:

$$\vec{r}^{\,\prime}=\vec{r}-\vec{a}_1{(\vec{r}\cdot\vec{a}_1)\over(\vec{a}_1\cdot\vec{a}_1)},$$

$$\vec{a}_2^{\,\prime}=\vec{a}_2-\vec{a}_1{(\vec{a}_2\cdot\vec{a}_1)\over(\vec{a}_1\cdot\vec{a}_1)},\quad\vec{r}^{\,\prime\prime}=\vec{r}^{\,\prime}-\vec{a}_2^{\,\prime}{(\vec{r}^{\,\prime}\cdot\vec{a}_2^{\,\prime})\over(\vec{a}_2^{\,\prime}\cdot\vec{a}_2^{\,\prime})}\ldots$$

Так как строки матрицы $$A(\vec{n}_i)$$ линейно зависимы, один из векторов $$\vec{a}_a$$ при ортогонализации из набора исключается. Для большей определенности алгоритма в качестве начального приближения перебираем базисные векторы, пока в результате ортогонализации не получится ненулевой вектор следующего приближения $$\vec{n}_{i+1}$$. В двумерном и трехмерном случае процесс ортогонализации значительно упрощается. Например, в трехмерном случае нетривиальный элемент ядра найдется среди тройки векторов $$\vec{a}_1\times\vec{a}_2, \vec{a}_1\times\vec{a}_3, \vec{a}_2\times\vec{a}_3$$.

Как показывают практические вычисления, последовательные приближения $$\vec{n}_i$$ быстро сходятся к искомому вектору нормали.

Ключевые слова: геометрия | Комментарии (5)

← сюда туда →