Черновики физика
Роман Парпалак

Задача о взвешенном выборе и случайной величине: единственность решения

13 июня 2020 года, 00:12

В прошлый раз мы решали задачу о взвешенной сортировке и показали, что существует функция $$f_w(x)$$, такая что максимальное значение этой функции $$\inline\max_{i=1,2,...n}\left\{f_{w_i}(x_i)\right\}$$ будет достигнуто на k-той паре $$(w_k, x_k)$$ с вероятностью, пропорциональной $$w_k$$, где $$x_i$$ — значение случайной величины, равномерно распределенной на единичном отрезке $$[0, 1]$$.

Мы потребовали непрерывности и монотонности функции $$f_w(x)$$ по $$x$$, а также зафиксировали значения на концах отрезка: $$f_w(0) = a, f_w(1) = b$$. В этих предположениях показали, что функция должна удовлетворять условию

$$ \int\limits_0^1dx_1\,f^{-1}_{w_2}\left(f_{w_1}(x_1)\right)\cdot f^{-1}_{w_3}\left(f_{w_1}(x_1)\right)\cdot\ldots\cdot f^{-1}_{w_n}\left(f_{w_1}(x_1)\right) ={w_1\over w_1+w_2+w_3+\ldots+w_n} $$(1)

для любых наборов значений $$w_i>0$$. Мы нашли целый класс подходящих под это условие функций:

$$f_w(x)=h(x^{1/w}),$$(2)

где $$h(y)$$ — любая строго монотонная функция.

Теперь докажем, что других решений у этой задачи не существует.

Теорема о единственности. Пусть для каждого значения $$w>0$$ функция $$f_w(x)$$ непрерывна и строго монотонна по $$x$$ на отрезке $$[0,1]$$, принимает на концах отрезка фиксированные значения $$f_w(0) = a, f_w(1) = b$$ и удовлетворяет (1). Тогда найдется такая строго монотонная функция $$h(y)$$, для которой выполняется тождество (2).

Доказательство будет конструктивным: мы построим конкретный пример $$h(y)$$ на основе вида функции $$f_w(x)$$.

Лемма 1. Обратная функция $$f^{-1}_w(s)$$ непрерывна по параметру $$w$$ на всем допустимом множестве значений параметра $$w>0$$.

Доказательство от противного. Пусть существует точка $$w_2$$, в которой $$f^{-1}_w(s)$$ не является непрерывной. Это значит, что

$$\exists\varepsilon>0\ \forall\delta_1>0\ \exists s\in[a,b]\ \exists w_3:|w_2-w_3|<\delta_1,\left|f^{-1}_{w_2}(s)-f^{-1}_{w_3}(s)\right|>\varepsilon.$$(3)

Так как функция $$f^{-1}_w(s)$$ непрерывна по $$s$$ на отрезке $$[a,b]$$, она равномерно непрерывна на нем в силу теоремы Кантора — Гейне. Из равномерной непрерывности следует, что $$|f^{-1}_{w_2}(s)-f^{-1}_{w_3}(s)|>\varepsilon/2$$ в некоторой $$\delta_2$$-окрестности точки $$s$$, причем $$\delta_2$$ зависит только от $$\varepsilon$$, не от $$s$$.

Аналогично функция $$f_w(x)$$ непрерывна и равномерно непрерывна на отрезке $$[0,1]$$. По $$\delta_2$$-окрестности точки $$s$$ можно найти $$\delta_3$$-окрестность точки $$x_1=f^{-1}_{w_1}(s)$$, для которой $$\left|f^{-1}_{w_2}(f_{w_1}(x_1))- f^{-1}_{w_3}(f_{w_1}(x_1))\right|>\varepsilon/2$$.

Это значит, что следующий интеграл от квадрата разности функций в соседних точках $$w_2$$ и $$w_3$$ ограничен снизу ненулевой величиной, не зависящей от $$\delta_1$$:

$$\int\limits_a^bdx\left[f^{-1}_{w_2}(f_{w_1}(x))- f^{-1}_{w_3}(f_{w_1}(x))\right]^2>{\delta_3\varepsilon^2\over 4}$$

Теперь непосредственно вычислим интеграл, раскрыв скобки и воспользовавшись условием (1):

$$ \begin{align*} &\int\limits_a^bdx\left[f^{-1}_{w_2}(f_{w_1}(x))- f^{-1}_{w_3}(f_{w_1}(x))\right]^2=\\ =&\!\int\limits_a^b\!dx\left[f^{-1}_{w_2}(f_{w_1}(x))\right]^2-2\!\int\limits_a^b\!dx\,f^{-1}_{w_2}(f_{w_1}(x))\, f^{-1}_{w_3}(f_{w_1}(x))+\!\int\limits_a^b\!dx\left[ f^{-1}_{w_3}(f_{w_1}(x))\right]^2=\\ =&{w_1\over w_1+2w_2}-2{w_1\over w_1+w_2+w_3}+{w_1\over w_1+2w_3}=\\ =&{2w_1\over(w_1+2w_2)(w_1+2w_3)(w_1+w_2+w_3)}(w_2-w_3)^2< C(w_1,w_2)\,\delta_1^2. \end{align*} $$

У нас есть оценки снизу и сверху для интеграла, обладающие очевидным свойством:

$${\delta_3\varepsilon^2\over 4} < C(w_1,w_2)\,\delta_1^2\implies\delta_1^2>{\delta_3\varepsilon^2\over 4C(w_1,w_2)}.$$

Но согласно отрицанию определения непрерывности (3) $$\delta_1$$ можно выбрать сколь угодно малым, при этом $$\varepsilon$$, $$\delta_3$$ и $$C(w_1,w_2)$$ зависят только от выбора $$w_2$$ и остаются фиксированными. Противоречие. $$\square$$

Лемма 2. Для любых значений $$k,m\in\mathbb{N}$$, $$w>0$$, $$s\in[a,b]$$ выполняется равенство

$$\left[f^{-1}_{w/k}(s)\right]^k=\left[f^{-1}_{w/m}(s)\right]^m.$$

Доказательство. Введем в (1) новую переменную $$s=f_{w_1}(x_1)$$:

$$ \int\limits_a^bds\ {\partial f^{-1}_{w_1}(s)\over\partial s}\ f^{-1}_{w_2}(s)\cdot f^{-1}_{w_3}(s)\cdot\ldots\cdot f^{-1}_{w_n}(s) ={w_1\over w_1+w_2+w_3+\ldots+w_n}. $$

Разделим набор весов $$w_2$$, $$w_3$$, … $$w_n$$ на две группы количеством $$k$$ и $$m$$, в каждой из которых веса совпадают и равны $$w/k$$ и $$w/m$$ соответственно. Тогда:

$$ \int\limits_a^bds\ {\partial f^{-1}_{w_1}(s)\over\partial s}\ \left[f^{-1}_{w/k}(s)\right]^k \left[f^{-1}_{w/m}(s)\right]^m ={w_1\over w_1+2w}\quad\forall k,m\in\mathbb{N}. $$

Последний интеграл можно интерпретировать как скалярное произведение функций $$[f^{-1}_{w/k}(s)]^k$$ и $$[f^{-1}_{w/m}(s)]^m$$ в пространстве с положительной в силу монотонности $$f^{-1}_{w_1}$$ метрикой $$\partial f^{-1}_{w_1}(s)/\partial s$$. По неравенству Коши — Буняковского скалярное произведение не превосходит произведения норм, и равенство достигается при коллинеарности сомножителей. Из последнего уравнения видно, что скалярное произведение совпадает с квадратом нормы каждого элемента. Поэтому в нашем случае имеет место равенство. Действительно, вычислим норму от квадрата разности функций:

$$ \begin{align*} &\int\limits_a^bds\ {\partial f^{-1}_{w_1}(s)\over\partial s}\ \left\{\left[f^{-1}_{w/k}(s)\right]^k- \left[f^{-1}_{w/m}(s)\right]^m\right\}^2=\\ =&\int\limits_a^bds\ {\partial f^{-1}_{w_1}(s)\over\partial s}\ \left\{\left[f^{-1}_{w/k}(s)\right]^{2k} -2\left[f^{-1}_{w/k}(s)\right]^k\left[f^{-1}_{w/m}(s)\right]^m +\left[f^{-1}_{w/m}(s)\right]^{2m}\right\}=0. \end{align*} $$

Если предполагать противное — непрерывные функции не совпадают хотя бы в одной точке — интеграл от квадрата их разности не может быть нулевым. Противоречие.

Несмотря на присутствие в выражениях производной $$\partial f^{-1}_{w_1}(s)/\partial s$$, дифференцируемость по $$s$$ в этом доказательстве не требуется. Замена переменной $$x_1$$ на $$s$$ была проведена для удобства. Аналогичные рассуждения имеют место и без замены переменных. $$\square$$

Следствие 1. Для любых значений $$r\in\mathbb{Q}_+$$, $$w>0$$, $$s\in[a,b]$$ выполняется равенство

$$f^{-1}_w(s)=\left[f^{-1}_{w/r}(s)\right]^r.$$

Доказательство. Представим положительное рациональное число $$r=m/k$$ как отношение натуральных чисел. В утверждении леммы 2 выполним замену $$w\to wk$$ и возведем обе части в степень $$1/k$$:

$$f^{-1}_w(s)=\left[f^{-1}_{wk/m}(s)\right]^{m/k}=\left[f^{-1}_{w/r}(s)\right]^r.\ \square$$

Следствие 2. Для любых значений $$p\in\mathbb{R}_+$$, $$w>0$$, $$s\in[a,b]$$ выполняется равенство

$$f^{-1}_w(s)=\left[f^{-1}_{w/p}(s)\right]^p.$$

Доказательство. Рассмотрим выражение $$[f^{-1}_{w/p}(s)]^p$$ как функцию от $$p$$. По следствию 1 в рациональных точках $$p$$ ее значение равно $$f^{-1}_w(s)$$. По лемме 1 функция непрерывна по параметру. Поэтому ее значение в иррациональных точках $$p$$ также равно $$f^{-1}_w(s)$$. $$\square$$

Доказательство теоремы. Из следствия 2 для любых $$p>0$$ выполняется равенство $$f_w(x)=f_{w/p}(x^{1/p})$$. Пусть $$p=w$$. Тогда

$$f_w(x)=f_1(x^{1/w})=h(x^{1/w}),$$

где $$h(y)\equiv f_1(y)$$ — строго монотонная функция. $$\square$$

Ключевые слова: теория вероятностей | Оставить комментарий
Роман Парпалак

Задача о взвешенном выборе и случайной величине

2 марта 2020 года, 23:28

Условие

Пусть заданы n положительных чисел $$w_1$$, $$w_2$$, … $$w_n$$. Для каждого из них выберем значение $$x_i$$ случайной величины, равномерно распределенной на единичном интервале (0, 1). Существует ли функция $$f_w(x)$$, такая что максимальное значение этой функции $$\inline\max_{i=1,2,...n}\left\{f_{w_i}(x_i)\right\}$$ достигается на k-той выбранной паре $$(w_k, x_k)$$ с вероятностью, пропорциональной $$w_k$$?

Мотивация

Задача возникла из следующей программистской проблемы. Пусть в базе данных есть таблица с колонкой весов w. Нужно выбрать из этой таблицы случайную строку с вероятностью, пропорциональной значению веса w.

Можно было бы провести одно испытание, выбрав значение случайной величины $$x$$, и взять среди сумм $$w_1_$$, $$w_1 + w_2$$, $$w_1 + w_2 + w_3$$, … первую, превосходящую $$x(w_1 + w_2 + ... + w_n)$$. Но такой перебор сделать сложнее в синтаксисе SQL. Проще отсортировать таблицу по некоторой функции от веса и случайного числа:

SELECT * FROM table ORDER BY f(w, random()) DESC LIMIT 1

Какую функцию нужно применить к весу и случайному числу, чтобы значение этой функции на некоторой строке оказалось наибольшим с вероятностью, пропорциональной весу?

Решение

Допустим, что функция $$f_w(x)$$ существует. Пусть в первом выборе случайная величина приняла значение $$x_1$$. Вычислим, с какой вероятностью значение $$f_{w_1}(x_1)$$ будет наибольшим. Нам нужно взять меру множества значений $$x_i$$, на котором выполняется система неравенств:

$$ \begin{equation*} \begin{cases} f_{w_1}(x_1) > f_{w_2}(x_2),\\ f_{w_1}(x_1) > f_{w_3}(x_3),\\ \cdots \end{cases} \end{equation*} $$(1)

Предполагаем, что $$f_w(x)$$ непрерывна и монотонно возрастает по $$x$$. Тогда существует обратная функция $$f^{-1}_w(y)$$. Чтобы упростить рассмотрение на границах, предположим, что $$f_w(x)$$ принимает одинаковые значения на концах отрезка для всех значений параметра:

$$ f_w(0) = a,\quad f_w(1) = b. $$(2)

Тогда решением системы (1) будет множество

$$0<x_i<f^{-1}_{w_i}\left(f_{w_1}(x_1)\right),\quad i>1.$$

Меру этого множества нужно проинтегрировать по всем значениям $$x_1$$, чтобы вычислить вероятность получения максимального значения в первом выборе. С другой стороны, эта вероятность нормирована на 1 и по условию пропорциональна $$w_1$$. Выводим следующее ограничение на функцию $$f_w(x)$$ для произвольных значений $$w_i$$:

$$ \int_0^1dx_1\,f^{-1}_{w_2}\left(f_{w_1}(x_1)\right)\cdot f^{-1}_{w_3}\left(f_{w_1}(x_1)\right)\cdot\ldots\cdot f^{-1}_{w_n}\left(f_{w_1}(x_1)\right) ={w_1\over w_1+w_2+w_3+\ldots+w_n}. $$(3)

Воспользуемся некоторыми эвристическими соображениями, которые позволяют угадать вид нашей функции. В интеграле можно перейти к новой переменной $$s=f_{w_1}(x_1)$$. Тогда подынтегральное выражение есть произведение величин $$f^{-1}_{w_2}(s)\cdot f^{-1}_{w_3}(s)\cdot\ldots\cdot f^{-1}_{w_n}(s)$$, а соответствующие веса в правой части входят только в виде суммы $$w_2+w_3+\ldots+w_n$$. Логично предположить, что обратная функция обладает показательным свойством по параметру:

$$f^{-1}_{w_2}(s)\cdot f^{-1}_{w_3}(s)\cdot\ldots\cdot f^{-1}_{w_n}(s) =f^{-1}_{w_2+w_3+\ldots+w_n}(s).$$(4)

Если обратная функция $$f^{-1}_w(y)$$ еще и непрерывна по этому параметру $$w$$, она имеет следующий вид: $$x=f^{-1}_w(y)=(g(y))^w$$, где $$g(y)$$ — некоторая новая монотонно возрастающая непрерывная функция. Отсюда следует, что прямая функция $$y=f_w(x)=g^{-1}(x^{1/w})$$.

Подставим полученный вид функций в интеграл из (3):

$$ \begin{align*} P_1&=\int_0^1dx_1\,\left(g\left(g^{-1}(x_1^{1/w_1})\right)\right)^{w_2}\cdot \left(g\left(g^{-1}(x_1^{1/w_1})\right)\right)^{w_3}\cdot\ldots=\\ &=\int_0^1dx_1\,\left(x_1^{1/w_1}\right)^{w_2+w_3+\ldots}= {1\over 1 +{w_2+w_3+\ldots\over w_1}}x_1^{1 +{w_2+w_3+\ldots\over w_1}}\Biggr|_0^1= {w_1\over w_1+w_2+\ldots+w_n}. \end{align*} $$

Таким образом, подстановка $$f_w(x)=g^{-1}(x^{1/w})$$ обращает уравнение (3) в тождество.

Вывод

Функция $$f_w(x)=x^{1/w}$$, а также ее композиция с любой монотонной функцией подходят для выбора из вариантов с заданными весами с помощью описанного в условии способа.

Обсудим единственность этого решения. Помимо естественного требования непрерывности и монотонности, мы наложили дополнительные ограничения (2) и (4). В этих предположениях решение единственно. В следующий раз мы рассмотрим вопрос единственности подробнее, а именно, появляются ли другие решения, если не требовать выполнения (2) и (4), а также можно ли вывести (2) и (4) непосредственно из условия или из более сильных ограничений на искомую функцию вроде дифференцируемости.

Ключевые слова: теория вероятностей | Оставить комментарий
Роман Парпалак

Хоккейная задача — 2

28 марта 2017 года, 23:50

Продолжим решать «хоккейную задачу». В прошлом посте мы рассмотрели вариант задачи с искусственной поддержкой постоянной скорости вращения кольца. Перейдем теперь к варианту, когда за счет трения замедляется не только поступательное движение, но и вращение.

Напомним, что динамика кольца описывается уравнениями

$$\begin{align*} {du\over dt}&=-\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{u-v\sin\alpha\over\sqrt{u^2+v^2-2uv\sin\alpha}},\\ {dv\over dt}&=-\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{v-u\sin\alpha\over\sqrt{u^2+v^2-2uv\sin\alpha}}, \end{align*}$$(1)

где $$v$$ — скорость поступательного движения, $$u=\omega R$$ — скорость вращательного движения кольца.

Система уравнений (1) симметрична относительно замены $$u$$ на $$v$$. Если в начальный момент $$u=v$$, то по соображениям симметрии это соотношение будет сохраняться между скоростями вплоть до остановки. Другой случай, который мы рассмотрим — это $$u>v$$. Противоположный случай $$u<v$$ будет вытекать из него простой заменой $$u$$ на $$v$$ из тех же соображений симметрии.

Вырожденный случай u = v

Оба уравнения системы принимают один и тот же вид

$${dv\over dt}=-\int\limits_0^{2\pi}{d\alpha\over 2\pi\sqrt2}\,\sqrt{1-\sin\alpha}={2\over\pi}.$$

Скорости совместного движения падают линейно со временем, но в $$\pi/2=1,\!57$$ раз медленнее отдельного вращения или отдельного поступательного движения.

Случай u > v

К сожалению, интегралы в системе (1) сводятся к эллиптическим, что не оставляет надежды решить систему аналитически. Остается численное решение.

Прямая попытка решить уравнение в Maple проваливается. Определенные интегралы заменяются нагромождением эллиптических интегралов, приводить которое здесь нет смысла. При построении графика мы видим сообщение об ошибке

Warning, cannot evaluate the solution past the initial point, problem may be complex, initially singular or improperly set up

Чтобы упростить выражения, накладываем ограничение $$u(t)\ge v(t)\ge 0$$ на каждый из интегралов.

sys_ode := {
    diff(u(t), t) = -`assuming`(
        [int(
            (u(t)-v(t)*sin(alpha))/sqrt(u(t)*u(t)+v(t)*v(t)-2*u(t)*v(t)*sin(alpha)),
            alpha = 0 .. 2*Pi
        )],
        [u(t) >= v(t) and v(t) >= 0, u(t) >= 0]
    )/(2*Pi),
    diff(v(t), t) = -`assuming`(
        [int(
            (v(t)-u(t)*sin(alpha))/sqrt(u(t)*u(t)+v(t)*v(t)-2*u(t)*v(t)*sin(alpha)),
            alpha = 0 .. 2*Pi
        )],
        [u(t) >= v(t) and v(t) >= 0, u(t) >= 0]
    )/(2*Pi), u(0) = 10, v(0) = 1
};

Ограничения устраняют сообщение об ошибке. Maple надолго задумывается, но выводит пустой график. Чтобы понять причину, выведем решение уравнения в какой-то точке.

p := dsolve(sys_ode, type = numeric):
p(1);

$$[t=1.,\\u(t)=10.9976102709142-2.84005015829721 10^{-8}{\rm I},\\v(t)=1.04887416587408+2.92542849266058 10^{-8}{\rm I}]$$

Накопление ошибки округления приводит к появлению ненулевой мнимой части в искомых функциях, из-за чего график пустой. Чтобы избежать появления мнимой части, возьмем в явном виде действительную часть правых частей уравнений:

sys_ode := {
    diff(u(t), t) = -Re(`assuming`(
        [int(
            (u(t)-v(t)*sin(alpha))/sqrt(u(t)*u(t)+v(t)*v(t)-2*u(t)*v(t)*sin(alpha)),
            alpha = 0 .. 2*Pi
        )],
        [u(t) >= v(t) and v(t) >= 0, u(t) >= 0]
    ))/(2*Pi),
    diff(v(t), t) = -Re(`assuming`(
        [Re(int(
            (v(t)-u(t)*sin(alpha))/sqrt(u(t)*u(t)+v(t)*v(t)-2*u(t)*v(t)*sin(alpha)),
            alpha = 0 .. 2*Pi
        )],
        [u(t) >= v(t) and v(t) >= 0, u(t) >= 0]
    ))/(2*Pi), u(0) = 10, v(0) = 1
};

Наконец, Maple, долго думая, всё же рисует график.

plots[odeplot](p, [
    [t, (10-t), color=gray],
    [t, sqrt(1-(1/10)*t), color=gray],
    [t, u(t), color = blue],
    [t, v(t), color = red]
], 0 .. 11);

При этом мы видим предупреждение о точке остановки вычислений, которая, очевидно, совпадает с моментом окончания движения:

Warning, cannot evaluate the solution further right of 10.155665, probably a singularity

Для численного решения мы выбрали начальную поступательную скорость 1 и скорость вращения 10. Без вращения кольцо перемещается в течение 1 единицы времени на расстояние 0,5. Наличие вращения привело к тому, что поступательное движение сохранялось более 10 единиц времени.

Линеаризованное решение при u >> v

График $$u(t)$$ — синяя линия — практически совпадает с прямой. График $$v(t)$$ — красная линия — напоминает параболу. Такое поведение предсказывается линеаризованным решением в пределе $$u\gg v$$. Пренебрегая $$v$$ в первом уравнении системы (1) и раскладывая второе по степеням $$p=v/u$$, получаем

$$\begin{align*} {du\over dt}&=-1,\\ {dv\over dt}&=-{v\over 2u}. \end{align*}$$(2)

Решением этой системы являются функции $$u(t)=u_0-t$$, $$v(t)=v_0\sqrt{1-t/u_0}$$. Их графики изображены серыми линиями.

Как видим из численного решения и графика, приближение верно описывает характер движения, пока $$u$$ и $$v$$ не становятся сравнимыми. Вот график для случая, когда одна скорость в два раза больше другой:

Здесь отличие от линеаризованного решения заметно практически сразу.

Путь до остановки: линеаризованное приближение

Пройденный кольцом путь дается площадью криволинейной трапеции под красной линией. В линеаризованном приближении криволинейная трапеция ограничена параболой и, как легко видеть, имеет площадь $$l=2u_0v_0/3$$. Если бы кольцо не вращалось, оно прошло бы расстояние $$l_0=v_0^2/2$$. Таким образом, чтобы увеличить проходимый путь в 5 раз, нужно закрутить кольцо с угловой скоростью

$$\omega_0={u_0\over R}={15\over 4}{v_0\over R}.$$

Напомним, что для прохождения кольцом того же пути при постоянном поддержании вращения его скорость должна быть в три раза меньше: $$\omega_0=(5/4)\,{v_0/R}$$.

Путь до остановки: численное решение

Теперь вычислим проходимый путь из первоначальных уравнений, без линеаризации.

Maple почему-то не нашел точку остановки («сингулярности») для начального значения 15/4 и некорректно продолжил решение. Приближенное положение этой точки находим подбором.

dsol2p := dsolve(sys_ode, type = numeric, output = listprocedure):
v := eval(v(t), dsol2p):
v(4.04);

$$0.00664275658541608$$

v(4.05);

$$0.000276558860981139$$

v(4.06);

$$0.00946581059191108$$

int(v(t), t = 0 .. 4.05);

$$2.5535588257745343$$

Последний результат Maple вычислял больше 10 минут. Как видим, для начального значения 15/4 погрешность линеаризованного приближения составляет 2%.

Вывод

Мы решили «хоккейную задачу» в исходной упрощенной формулировке и без упрощений в линеаризованном приближении. С помощью системы компьютерной алгебры Maple убедились, что для условия этой задачи линеаризованное приближение дает ошибку на несколько процентов.

Ключевые слова: механика, maple | Оставить комментарий
Роман Парпалак

Хоккейная задача

5 февраля 2017 года, 11:58

В 2007 году на физтеховской олимпиаде по физике была такая задача:

Тонкое кольцо лежит на шероховатой горизонтальной поверхности. После толчка в направлении центра кольца оно перемещается на некоторое расстояние. Когда это кольцо раскрутили до некоторой угловой скорости (поддерживаемой постоянной за всё время движения), то при той же начальной скорости кольцо прошло в $$k$$ раз большее расстояние. Как было раскручено это кольцо? (попытайтесь в ответе найти нелинейную поправку). (В.С. Булыгин)

На примере этой задачи я хочу показать, как использовать системы компьютерной алгебры, в частности, Maple.

В условии поддержка постоянной угловой скорости вращения выглядит искусственно. Это требование упрощает задачу, чтобы ее можно было решить на олимпиаде. В этом посте рассмотрим такую формулировку, а в следующем — потерю через трение не только поступательной скорости, но и вращательной.

Физическая сторона задачи

Решение задачи разобрано на Элементах (там ее назвали «хоккейной задачей»). Физическая часть решения не требует выхода за рамки школьных знаний, на ней останавливаться не будем. А вот на математике остановимся подробнее. Начнем с системы уравнений, выведенной по ссылке выше:

$$\begin{align*} {du\over dt}&=-\mu g\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{u-v\sin\alpha\over\sqrt{u^2+v^2-2uv\sin\alpha}},\\ {dv\over dt}&=-\mu g\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{v-u\sin\alpha\over\sqrt{u^2+v^2-2uv\sin\alpha}}. \end{align*}$$(1)

Здесь $$v$$ — скорость поступательного движения, $$u=\omega R$$ — скорость вращательного движения кольца.

Уравнения таковы, что соответствующим выбором единицы измерения времени мы можем избавиться от несущественного множителя $$\mu g$$, поэтому в рассуждениях ниже мы его опустим.

Предельный режим

В предположении $$u=const$$ уравнение на $$v$$ имеет простой предельный режим, когда $$v\to 0$$. Тогда раскладывая подынтегральное выражение в ряд по $$v$$ с точностью до второго порядка малости и интегрируя, видим, что убывание скорости пропорционально самой скорости. При малых скоростях кольцо останавливается по экспоненте, как будто трение не сухое, а жидкостное.

Случай постоянной скорости вращения

По условию угловая скорость вращения поддерживается постоянной, а линейная скорость падает до 0. Логично предположить, что мы имеем дело с режимом $$0<v<u=\text{const}$$. Пусть $$p=v/u$$. Тогда

$$u{dp\over dt}&=-\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{p-\sin\alpha\over\sqrt{1+p^2-2p\sin\alpha}}.$$(2)

До остановки кольцо проходит расстояние

$$l=\int\limits_0^{t_\text{ост}} v\,dt=u\int\limits_0^{t_\text{ост}} p\,dt.$$(3)

Подставим $$dt$$ из (2) в (3):

$$u^2\int\limits_{p_0}^0{p\,dp\over-\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{p-\sin\alpha\over\sqrt{1+p^2-2p\sin\alpha}}}=u\int\limits_0^{t_\text{ост}} p\,dt=l.$$(4)

Когда вращения нет, кольцо движется равнозамедленно и проходит расстояние $$l_0=v_0^2/2$$. Вращающееся кольцо проходит в $$k=5$$ раз большее расстояние $$l$$:

$$l=kl_0=k\,{v_0^2\over 2}=ku^2\,{p_0^2\over 2}.$$

Подставим $$l$$ в (4) и поделим на $$p_0^2$$:

$${1\over p_0^2}\int\limits^{p_0}_0{p\,dp\over\int\limits_0^{2\pi}{d\alpha\over 2\pi}\,{p-\sin\alpha\over\sqrt{1+p^2-2p\sin\alpha}}}={k\over 2}.$$(5)

Это уравнение дает нам соотношение между начальной скоростью вращения кольца $$\omega_0=v_0/(p_0R)$$ и ростом проходимого до остановки расстояния $$k$$.

Численное решение в Maple

Внутренний интеграл выражается через эллиптические интегралы. Однако Maple ничего не знает про знак $$p$$ и выдает слишком громоздкое выражение, содержащее фрагменты вроде $$\sqrt{-{2p/(p-1)^2}}$$, csgn(p-1). Подскажем очевидное ограничение на $$p$$:

`assuming`([
    int(
        (p-sin(alpha))/(2*Pi*sqrt(p^2 + 1 - 2*p*sin(alpha))),
        alpha = 0 .. 2*Pi
    )
], [p > 0]):
factor(%);

$${\left(p-1\right)\mathrm{EllipticK}\left(\dfrac{2\sqrt{p}}{p+1}\right)+\left(p+1\right)\mathrm{EllipticE}\left(\dfrac{2\sqrt{p}}{p+1}\right)\over p\pi}$$

После этого легко подобрать ответ $$p_0$$ с нужной точностью:

p0 := 0.78:
(int(
    p^2 * Pi / (
        (p-1) * EllipticK(2*sqrt(p)/(p+1)) +
        (p+1) * EllipticE(2*sqrt(p)/(p+1))
    ),
    p = 0 .. p0
)) / p0^2;

$$2.491446599$$

В начальный момент скорости поступательного движения и вращения были связаны соотношением $$v_0\approx0,\!78\,\omega_0R$$.

Приближенный ответ можно получить не только численно, но и из разложения внутреннего интеграла в ряд

expand(series(`assuming`([int(...)], [p >= 0]), p = 0, 8));

$${1\over 2}p+{1\over 16}p^3+{3\over 128}p^5+O(p^7)$$

Вычислим левую часть (5) при $$p_0=0,\!78$$, последовательно уточняя разложение внутреннего интеграла:

$$\begin{align*} &{1\over 0,\!78^2}\int\limits_0^{0,78}{p\over{\frac{1}{2}p}}\,dp=2,\!564102564,\\ &{1\over 0,\!78^2}\int\limits_0^{0,78}{p\over{\frac{1}{2}p+{1\over 16}p^3}}\,dp=2,\!501916372,\\ &{1\over 0,\!78^2}\int\limits_0^{0,78}{p\over{\frac{1}{2}p+{1\over 16}p^3+{3\over 128}p^5}}\,dp=2,\!493976851. \end{align*}$$

Хотя начальное значение параметра $$p_0=v_0/u_0=0,\!78$$ нельзя назвать малым, линеаризация по этому параметру дает погрешность менее 3%. Для линейного приближения ответ составил бы $$p_0=4/k=0,\!8\,$$. А учет кубической поправки уже дает погрешность меньше процента.

Ключевые слова: механика, maple | Оставить комментарий
Роман Парпалак

Скрытый импульс

20 сентября 2015 года, 21:12

Недавно на гиктаймсе писали про невозможный двигатель на электромагнитной тяге. Для появления такой тяги физических оснований нет, обсуждать его мы не будем. А вот в комментариях завязалась интересная дискуссия о том, может ли замкнутая покоящаяся система изменить свой электромагнитный импульс и за счет отдачи прийти в состояние макроскопического движения. Краткий ответ — нет. Развернутый ответ — ниже.

Введение

Ранее мы рассматривали потоки электромагнитной энергии в постоянных электрических и магнитных полях. Эти потоки были замкнутыми. Однако можно составить такую систему неподвижных источников электрического и магнитного полей, в которой потоки энергии не замкнуты. Следовательно, такие системы обладают ненулевым суммарным электромагнитным импульсом.

Пример такой системы — тороидальный магнит внутри цилиндрического конденсатора. Покажем, что в ней запасается ненулевой электромагнитный импульс.

$$\begin{tikzpicture}[line width=0.21mm,scale=1.898] \coordinate (A) at (1.7,2.3); \draw[dashed,color=gray] (1.9,0.7) arc (-80:80:-0.2 and 0.8) (2.25,0.9) arc (-150:150:-0.5 and 1.2);%torus \draw[thin,dashed,color=gray] (0,1.5) ellipse (0.146 and 0.6) ++(0,-0.6) -- +(1.4,0) +(1.8,0) -- +(4,0) ++(0,1.2) -- +(1.4,0) +(1.8,0) -- +(4,0); \draw (4,1.5) ellipse (0.146 and 0.6) node {$-$} ++(0,-0.6) -- +(-0.45,0) ++(0,1.2) -- +(-0.45,0); \draw[thin,dashed,color=gray] (0,0) arc (-90:90:0.5 and 1.5);%l.ell \draw (4,0) -- (0,0) arc (270:90:0.5 and 1.5) -- +(4,0); \draw (4,1.5) ellipse (0.5 and 1.5);%r.ell \draw (-0.8,1.5) node {$+$}; \draw[thin,->] (A) -- +(0.6,0) node[right] {$\vec{S}$}; \draw[thin,->] (A) -- +(0.4,0.5) node[right] {$\vec{B}$}; \draw[thin,->] (A) -- +(0.15,-0.6) node[right] {$\vec{E}$}; \draw[opacity=0] (-0.9,0) rectangle (4.5,3); \end{tikzpicture}$$

Внутри магнита электрическое поле направлено по радиальным линиям, магнитное — по концентрическим окружностям, а вектор Пойнтинга $$\vec{S}\sim\vec{E}\times\vec{B}$$ — вдоль оси конденсатора. Снаружи соленоида нет магнитного поля и потоков энергии. Поэтому суммарный электромагнитный импульс в такой системе направлен вдоль оси симметрии.

На первый взгляд ненулевой импульс у внешне покоящейся системы выглядит крайне странно и приводит к парадоксам. Например, при изменении тока через соленоид изменяется импульс электромагнитного поля. Система получает механический импульс отдачи и начинает перемещаться. После закачки энергии в сверхпроводящий соленоид замкнутая система без взаимодействия со внешними телами перемещается в произвольном направлении на произвольное расстояние?! Это более чем странно.

Из специальной теории относительности следует, что импульс замкнутой системы относительно центра масс равен нулю (теорема о центре масс). Следовательно, электромагнитный импульс компенсируется импульсом другой природы. Его называют «скрытым импульсом».

Впервые понятие скрытого импульса ввели Шокли и Джеймс в 1967 году. Сведения о скрытом импульсе в доступной форме систематизированы в статье «Hidden momentum, field momentum, and electromagnetic impulse» (David Babson, Stephen P. Reynolds, Robin Bjorkquist and David J. Griffiths).

Сначала докажем теорему о центре масс. Затем выведем величину скрытого импульса модельной системы, которая встречается у Шокли и Джеймса. Также объясним природу скрытого импульса в различных системах. В завершение рассмотрим основные ошибки критиков скрытого импульса.

Ниже мы употребляем понятия «импульс» и «поток энергии» как синонимы. В специальной теории относительности эти величины пропорциональны с коэффициентом $$c^2$$, так как связаны с компонентами симметричного тензора энергии-импульса.

Теорема о центре масс

Докажем, что суммарный импульс замкнутой системы относительно ее центра масс равен нулю. Мы используем тензорные обозначения четырехмерных величин.

Координаты $$X^i$$ центра масс (точнее, центра энергии):

$$X^i=\cfrac{\int x^i\,T^{00}\,d^3x}{\int T^{00}\,d^3x},$$

где плотность энергии $$T^{00}$$ определяется временной компонентой тензора энергии-импульса. Заметим, что у замкнутой системы полная энергия $$\inline\int T^{00}\,d^3x}$$ не зависит от времени (докажите это в качестве упражнения).

По условию теоремы координаты центра энергии не меняются со временем. Продифференцируем их по времени и приравняем к нулю:

$$\int x^i\,{\partial T^{00}\over\partial x^0}\,d^3x}=0.$$

Воспользуемся законом сохранения энергии $$\partial_\mu T^{\mu\nu}=0$$ и перепишем подынтегральное выражение:

$$x^i\,\partial_0 T^{00}=-x^i\,\partial_j T^{j0}=-\partial_j(x^iT^{j0})+T^{j0}\,\partial_j x^i=-\partial_j(x^iT^{j0})+T^{i0}.$$

Интеграл от первого слагаемого как от дивергенции приводится с помощью теоремы Гаусса к интегралу по бесконечно удаленной поверхности от нулевой (на бесконечности) функции. В итоге мы получили, что интеграл от плотности потока энергии $$T^{i0}$$ с необходимостью нулевой. Таким образом, полный поток энергии относительно центра масс системы равен 0.

Cкрытый импульс в модельной системе

Рассмотрим виток с током в однородном электрическом поле. В такой системе тоже есть ненулевой момент импульса электромагнитного поля.

Чтобы выявить природу компенсирующего скрытого импульса, применим модель витка с током постоянного сечения S, в которой носители заряда движутся свободно, без сопротивления.

$$\newcommand{\mycharge}[1][]{ \fill[red!80] (#1) circle (0.49mm); \draw[white,line width=0.21mm] (#1) +(-1pt,0) -- +(1pt,0) +(0,-1.0pt) -- +(0,1.0pt); } \begin{tikzpicture}[join=round,scale=2.109,>=stealth] \def\w{0.08} \def\p{0.1} \draw (2.5,0.5)--(2.5,1.5) [->] node[right] {$\vec{E}$}; \draw (-\p,\w)--(-\p,2-\w) [<->,gray] node[midway,left,black] {$h$}; \draw (\w,-\p)--(2-\w,-\p) [<->,gray] node[midway,below,black] {$l$}; \draw (0.25,0.25) node {$A$} (0.25,1.75) node {$B$} (1.75,0.25) node {$D$} (1.75,1.75) node {$C$}; \draw[rounded corners=1,line width=3.15mm,brown!34](\w,\w)--(2-\w,\w)--(2-\w,2-\w)--(\w,2-\w)--cycle; \foreach \x in {0.1,0.40,...,2.0} \mycharge[\x,0.08]; \foreach \x in {0.1,0.7,...,2.0} \mycharge[\x,1.92]; \foreach \x in {0.45,0.87,1.35} \mycharge[0.08,\x]; \foreach \x in {0.45,0.87,1.35} \mycharge[1.92,\x]; \draw (1.2,0.25)--(0.8,0.25) [->] node[midway,above] {$\vec{v}_1$}; \draw (1,1.75)+(-0.5,0)-- +(0.5,0) [->] node[midway,below] {$\vec{v}_2$}; \draw[opacity=0,line width=0.21mm] (-0.27,-0.30) rectangle (2.72,2); \end{tikzpicture}$$

Пусть в точке A носители заряда имеют скорость $$v_1$$. На участке AB за счет работы электрического поля их скорость растет до величины $$v_2$$. Одновременно с этим снижается плотность носителей заряда, чтобы величина тока $$I=jS=qnvS$$ оставалась постоянной: $$n_1v_1=n_2v_2$$. Далее носители движутся с постоянной скоростью до точки C, замедляются до $$v_1$$ к точке D и возвращаются на этой скорости в точку A.

В нерелятивистском случае, когда импульс одного носителя заряда есть $$p=mv$$, полный импульс носителей на участках BC и AD равен

$$P_\text{нерел}=mv_2n_2Sl-mv_1n_1Sl=0.$$

Но если учесть релятивистские эффекты, когда $$p=\gamma mv$$,

$$P_\text{рел}=\gamma_2mv_2n_2Sl-\gamma_1mv_1n_1Sl=(\gamma_2-\gamma_1){mIl\over q}.$$

Разность кинетической энергии $$K=\gamma mc^2$$ носителей на этих участках определяется работой электрического поля:

$$\gamma_2 mc^2-\gamma_1 mc^2=qEh.$$

Таким образом,

$$P_\text{скр}={IlEh\over c^2}={\mu E\over c^2},$$

где $$\mu$$ — магнитный момент витка с током.

Результат легко обобщается на случай произвольного точечного магнитного диполя в неоднородных электрических полях. Электрическое поле, перпендикулярное плоскости витка, не влияет на движение зарядов. Переходя от проекции электрического поля на плоскость витка к вектору, получаем

$$\vec{P}_\text{скр}={1\over c^2}\,\vec\mu\times\vec{E}.$$

Можно показать, что электромагнитный импульс в системе из заряда q и диполя $$\mu$$ определяется формулой

$$\vec{P}_\text{эм}=-{1\over c^2}\vec\mu\times\vec{E},$$

где $$\vec{E}=q\vec{R}/R^3$$ — электрическое поле заряда в точке, где находится диполь. Электромагнитный импульс полностью компенсируется скрытым импульсом. Мы не будем делать расчет конкретно для этой системы. Вместо этого покажем, что такая компенсация происходит всегда.

Скрытый импульс и импульс электромагнитного поля

В произвольном электростатическом поле с потенциалом $$\varphi$$ выражение для скрытого импульса витка с током I приобретает вид

$$\vec{P}_\text{скр}=-{I\over c^2}\oint\varphi\,d\vec{l}.$$

Если задана объемная плотность тока $$\vec{j}$$, то

$$\vec{P}_\text{скр}=-{1\over c^2}\int\varphi\vec{j}\,dV.$$

Подставим в последнюю формулу уравнение Максвелла для стационарных полей $$\nabla\times\vec{B}=(4\pi/c)\vec{j}$$:

$$\begin{align*} \vec{P}_\text{скр}&=-{1\over 4\pi c}\int\varphi\,\nabla\times\vec{B}\,dV=-{1\over 4\pi c}\int\left(\nabla\times\varphi\vec{B}-\nabla\varphi\times\vec{B}\right)\,dV=\\ &={1\over 4\pi c}\oint\varphi\vec{B}\times d\vec{S}-{1\over 4\pi c}\int\vec{E}\times\vec{B}\,dV=-{1\over c^2}\int\vec{S}\,dV=-\vec{P}_\text{эм}. \end{align*}$$

Первое слагаемое — интеграл по бесконечно удаленной поверхности — для замкнутых ограниченных в пространстве систем равен 0. Таким образом, мы получили, что ненулевой полный электромагнитный импульс системы всегда компенсируется скрытым импульсом. Полный импульс покоящейся стационарной системы — нулевой.

Природа скрытого импульса

Скрытый импульс связан с механическим движением носителей зарядов. Масса носителей фигурировала в выводе, но сократилась в итоговом ответе.

Скрытый импульс имеет релятивистский характер. Если бы не поправки специальной теории относительности, скрытый импульс был бы нулевым.

Природа скрытого импульса зависит от самой системы. В рассмотренной выше модели скрытый импульс (и поток энергии) связан с ускорением зарядов. В модели тока заряженной несжимаемой жидкости скрытый поток энергии вызывается перепадом давления. Во вращающемся заряженном диэлектрике (например, в сфере) импульс и поток энергии запасен в движении участков с разным механическим напряжением.

$$\begin{tikzpicture}[scale=2.109,line width=0.21mm,draw=red,node distance=4cm] \draw [fill=red!10] circle (0.7); \draw (-120:.15) [->,thin,black] arc(240:-60:.15); \def\n{12} \foreach \s in {1,...,\n} \node at ({360/\n * (\s-1)}:0.6) {$+$}; \node[fill=red!10,draw,circle] at (0,-1.3) {$+$}; \draw (0,-0.844) node {$\text{растянуто}$}; \draw (0,0.82) node {$\text{сжато}$}; \draw[line width=5,draw=black!20] (2,-0.3)+(0,-0.5) arc (270:90:0.5) -- +(2,0) node[midway,above=0.05mm] {$\text{натяжение меньше}$} arc (90:-90:0.5) -- +(-2,0) node[midway,below=-0.1mm] {$\text{натяжение больше}$}; \draw[fill=green!10,draw=green!40!black] (2,-0.3) circle(0.46) +(2,0) circle(0.46); \draw (2,-0.3) +(-120:.1) [->,thin,black] arc(240:-60:.1); \end{tikzpicture}$$

Поток механической энергии в последнем случае аналогичен потоку энергии в ременной передаче. Нижняя половина ремня на рисунке справа перемещается от нагрузки к двигателю. Она натянута больше, чем верхняя. При этом поток механической энергии направлен к нагрузке.

В настоящих электромагнитах скрытого импульса нет

В примере из введения нельзя заменить тороидальный магнит на соленоид с током. Если намотать соленоид металлическим проводом, то ни скрытого импульса внутри него, ни электромагнитного импульса снаружи не будет.

Всё дело в экранировке внешнего электрического поля в металле. Перераспределение поверхностных зарядов приводит к тому, что поверхность идеального проводника становится эквипотенциальной, и интеграл от плотности скрытого импульса $$-\varphi\vec{j}$$ зануляется.

Также исчезает и электромагнитный импульс. Электрическое поле перпендикулярно эквипотенциальным поверхностям, а вектор Пойнтинга направлен по касательным к ним. Потоки энергии текут вдоль эквипотенциальных поверхностей и вынуждены быть замкнутыми.

Ненулевое сопротивление настоящих металлов приводит к падению потенциала вдоль проводника и попаданию части потока энергии внутрь. Энергия исходит из источника тока и перемещается к проводнику, в котором переходит в тепло. Такая система уже нестационарна. В ней энергия перемещается от одной части к другой, и полный импульс отличен от нуля.

Чтобы в системе появился и электромагнитный, и скрытый импульс, вместо электромагнита надо взять неметаллический источник магнитного поля. Скрытый импульс $$-\varphi\vec{j}$$ будет запасен в молекулярных токах Ампера.

Критика скрытого импульса

Понятие скрытого импульса часто подвергается критике недостаточно компетентными авторами. Рассмотрим распространенные ошибки критиков на примере текста некоего Джеррольда Франклина.

  1. В статье рассуждения начинаются не с вектора Пойнтигна, выражение для которого выводится из принципа наименьшего действия, а с применения третьего закона Ньютона к силе Лоренца. Начиная не с общих формул, а с частных, нельзя прийти к общим выводам.

  2. Утверждается, что теорему о центре масс нельзя применить к электромагнитному полю, потому что взаимодействие с веществом $$-\vec{j}\cdot\vec{E}$$ нарушает равенство $$\partial_\mu T^{\mu\nu}_\text{эм}=0$$. Но правильно применять теорему к полной системе, включающей и электромагнитное поле, и вещество, а не к ее части.

  3. Автор критикует модель витка с током, заявляя, что в ней появятся поверхностные заряды, компенсирующие внешнее электрическое поле. Аргумент имеет смысл только для систем с точной компенсацией зарядов разного знака вроде металлических проводников. Его легко обойти, потребовав, чтобы все заряды в витке были одного знака.

  4. Еще одна грубая ошибка присутствует в предложении, по которому перераспределение зарядов по поверхности металлического проводника не приводит к исчезновению электромагнитного импульса. Суммарный ненулевой электромагнитный импульс присутствует в системе с ненулевым суммарным потоком электромагнитной энергии. Он появляется в системе с источниками и стоками энергии $$-\vec{j}\cdot\vec{E}\ne 0$$. Внутри и снаружи идеального проводника $$\vec{j}\cdot\vec{E}=0$$, электрическое поле существенно искажается и суммарный электромагнитный поток энергии исчезает.

  5. Неверный логический переход в следующем выводе: во вращающихся диэлектрических заряженных телах не может быть ускорения носителей зарядов и связанной релятивистской добавки, и поэтому в ней нет скрытого импульса. На самом деле скрытый импульс есть, он имеет другую природу и связан с механическим напряжением, как мы показали выше.

Автору не удалось показать ни неприменимость теоремы о центре масс, ни отсутствие необходимости во введении понятия скрытого импульса, ни отсутствие самого скрытого импульса.

Ключевые слова: электродинамика | Комментарии (4)

туда →