Уравнение


Contributors to Wikimedia projects

Article Images

В математиката уравнението представлява два математически израза, свързани помежду си със знак за равенство. То може да съдържа една или повече променливи. Решаването на уравнението се състои в намирането на стойностите на променливите, за които равенството е изпълнено. Променливите се наричат също така неизвестни, а стойностите, за които равенството е изпълнено – решения на уравнението. В различните езици значението на думата може да има различни значения[2]. За разлика от тъждеството, което е изпълнено за всички стойности на променливата, уравнението е равенство, което може да е изпълнено само за някои стойности на променливата.[3]


Най-старото известно уравнение, публикувано през 1557 година от Робърт Рекърд, който въвежда и знака „=“ за означаване на равенство[1]
Динамичните системи се описват с уравнения, чиито решения са функции, като изобразения на графиката странен атрактор

Съществува голямо разнообразие от уравнения, които намират приложение в различни области на математиката, като методите за тяхното решаване се различават в зависимост от вида на уравнението.

В алгебрата се разглеждат две основни групи уравнения – полиномните уравнения и системите линейните уравнения. Полиномните уравнения имат общия вид P(х) = 0, където P е полиномна функция, а системите линейни уравнения – a(x) + b = 0, където a линейно изображение, а b и неизвестното x са вектори. За решаването на алгебричните уравнения се използват алгоритмични или геометрични методи, базирани на линейната алгебра или математическия анализ.

Алгебрата изследва и диофантовите уравнения, при които коефициентите и решенията са цели числа, като при тях се използват различни методи, основани на аритметиката. Тези уравнения обикновено са трудни и най-често при тях се търси само дали съществуват решения и какъв е техният брой.

В геометрията уравненията се използват за описване на различни геометрични обекти. Тук целта не е намирането на решения, а демонстрирането и изследването на определени геометрични свойства. В тази област приложение намират две големи групи уравнения – декартови и параметрични.

Математическият анализ изследва уравнения от вида f(x) = 0, където f е функция с определени свойства, като непрекъснатост и диференцируемост. Методите за решаване на тези уравнения дават възможност за конструиране на сходящи поредици от решения, като целта е да се достигне до възможно най-точното решение.

Динамичните системи се дефинират чрез уравнения, чиито решения са редици или функции на една или повече променливи. В този контекст се разглеждат два основни въпроса – за началното състояние и за асимптотичното поведение. За всяко допустимо начално състояние, например стойността на редицата или функцията в нулата, уравнението допуска определено единствено решение. Чувствителността на решенията към малки промени в началното състояние е една от основните задачи. Асимптотичното поведение на дадено решение е формата на решението при стойности на променливата, клонящи към минус или плюс безкрайност. Ако решението не е разходящо, то може да клони към дадена стойност, да има цикличен характер или да има хаотично поведение.

Неизвестни, решения, еквивалентни преобразувания

редактиране

Следният пример е взет от книгата „Китаб ал-джабр уал-мукабала“ на Мохамед ал-Хорезми, един от основоположниците на алгебрата[4]

Един човек умрял и оставил поравно наследството си на четиримата си синове, като направил дарение на един човек, равно на дела на един от синовете си, а на друг човек дарил четвърт от разликата между една трета от наследството и първото дарение.

Търси се делът от наследството, който се пада на всеки син. Ако този неизвестен дял се означи с x, задачата се преобразува в следното уравнение:   в което числото 1 вдясно обозначава цялото наследство.

Равенството (1) е математически модел на описаната задача. За да се получи отговорът, трябва да се определи стойността на неизвестното x, за която равенството е изпълнено; тази стойност на неизвестното се нарича решение или корен на уравнението. Решаването на уравнението, тоест намирането на стойността на неизвестното, става с помощта на еквивалентни преобразувания

Две уравнения се наричат равносилни (еквивалентни), ако имат едно и също дефиниционно множество и едни и същи корени. Основни еквивалентни преобразувания:

  • Размяна на двете страни на равенството.
  • Събиране на двете страни на равенството с един и същи израз, който не стеснява дефиниционното множество.
  • Изваждане от двете страни на равенството на един и същи израз, който не стеснява дефиниционното множество.
  • Умножаване или разделяне на двете страни на равенството с един и същи израз, който е различен от нула и не стеснява дефиниционното множество.
  • Степенуване на двете страни на равенството с един и същи степенен показател, който е различен от нула и не стеснява дефиниционното множество.

Решаването на уравнението от примера може да стане по следния начин:

  • Опростяване на израза вляво:
  • Изваждане на 1 / 12 от двете страни на равенството:
  • Умножаване с 4 / 19 на двете страни на равенството:
  • Намереното решение означава, че всеки от синовете е получил 11 / 57 от наследството.

Параметри в уравненията са променливи, чиито стойности се смятат за известни (дадени). Уравнения, които освен неизвестно съдържат и параметър, се наричат параметрични уравнения. Използвани са за пръв път през XVI век от Франсоа Виет като средство за общо решаване на цели групи уравнения,[5] като тези в следния пример:

Пример за параметрично уравнение[6]
 
Графиката на функцията f е парабола, показана в синьо на схемата, графиката на g1(x) е правата в червено, тази на g-2(x) – във виолетово и тази на g-1 – в зелено

Търси се броят на реалните корени на следните уравнения:  

Задачата може да се реши, като се въведе функцията f(x), която съпоставя на всяко x стойността x2. Нейната графика е квадратна парабола, показана в синьо на схемата вдясно. Функцията g1(x) съпоставя на x стойността 2.x +1 (червената права). Корените на уравнение (1) са абсцисите на пресечните точки на параболата и червената права, като графичното представяне показва, че съществуват две решения, съответстващи на двете пресечни точки. За решаването на уравнение (2) се въвежда функцията g-2(x), която съпоставя на x стойността 2.x -2 (виолетовата права). Тя не пресича параболата, което означава, че уравнението няма решение. В последния случай се въвежда функцията g-1(x), която съпоставя на x стойността 2.x -1 (зелената права). Нейната графика е права, успоредна на първите две, която има една обща точка с параболата и съответно третото уравнение има едно решение.

Задачата може да се реши по по-общ начин, като в уравненията се въведе параметър a, който може да заема произволни стойности, а трите уравнения се разглеждат като частни случаи при стойности на параметъра a 1, -2 и -1:  <

Уравнение (4) се нарича параметрично уравнение, а променливата a – параметър.

 
Графиката на полинома X5 – 3X + 2 показва, че той има поне четири корена (петият не се вижда на тази графика), и илюстрира основната теорема на алгебрата в този частен случай

Основна категория уравнения, изследвани от алгебрата, са полиномните уравнения, които имат общия вид:

където an ≠ 0, а стойността n се нарича степен на уравнението.

Наличието на добре разработени методи за решаването на полиномни уравнения дава възможност за решаването чрез подходяща замяна на неизвестното и на други групи уравнения. Например, уравнението e2x – (ea + eb)ex + ea+b = 0 може да бъде трансформирано в полиномно уравнение от втора степен чрез полагането X = ex.

Решаването на полиномните уравнения от първите няколко степени е сравнително просто. При уравненията от първа степен (линейни уравнения) решението е:

При уравненията от втора степен (квадратни уравнения) корените също може да се получат в явен вид, когато коефициентите и корените са реални числа:

където условието за реалност на корените е стойността под квадратния корен, наричана дискриминанта, да бъде по-голяма или равна на нула.

Решаването на полиномните уравнения от трета степен (кубични уравнения) е по-сложна задача. Италианските математици през Ренесанса установяват, че получаването на общо решение изисква добавянето на нов вид числа – имагинерните.[7] Това откритие дава възможност за намирането в явен вид на общото решение на уравненията от трета и четвърта степен.

По-късно е изведена и основната теорема на алгебрата, според която всяко алгебрично уравнение от положителна степен с реални или комплексни коефициенти има поне един комплексен корен. Макар че тази теорема гарантира съществуването на решение, тя не предлага метод за намирането му. Теоремата на Руфини—Абел дава обяснение на този факт, като показва, че общото алгебрично уравнение от пета или по-висока е нерешимо в радикали. Този извод, чието пълно доказателство е намерено от Нилс Абел, е допълнен от Еварист Галоа, който намира необходимо и достатъчно условие за решимостта на алгебрично уравнение с дадени коефициенти. В историята на математиката основната теорема на алгебрата и теоремата на Руфини—Абел образуват популярната през XIX век теория на уравненията, която днес не се смята за самостоятелна област на математиката.

 
„Дзиуджан Суаншу“, китайска книга от II век пр.н.е., описваща вариант на метода на Гаус за решаване на системи линейни уравнения

Друга група уравнения, изследвани от алгебрата, са векторните линейни уравнения от вида:

където a е линейно изображение на векторното пространство E във векторното пространство F, b е вектор от пространството F, а x е променлива, дефинирана в пространството E.

Ако пространствата E и F са с крайна размерност, съответно n и m, изборът на база на E и F дава възможност изображението a да се представи под формата на матрица (ajk), x – под формата на вектор стълб с n координати (xk) и b – като вектор стълб с m координати (bj). Така векторното линейно уравнение може да бъде записано като система от линейни уравнения:

Системите линейни уравнения намират широко приложение в науката и техниката, често в методи за приблизително решаване на диференциални уравнения, поради което съществуват множество методи за тяхното решаване. В случая, когато размерностите n и m са равни и детерминантата на матрицата a е различна от нула, решението на системата може да бъде получено в явен вид чрез метода на Крамер. Този начин за решаване на системите е неефективен и в практиката по-често се използват итерационни алгоритми, като метода на Гаус.[8] Неговата цел е да отдели неизвестните, като чрез поредица еквивалентни преобразувания получи линейни уравнения с едно неизвестно. Методът на Гаус е известен още през древността. Негов вариант е описан в глава 8 на китайската математическа книга от II век пр.н.е. „Дзиуджан Суаншу“.[9]

Геометрична интерпретация на линейните уравнения

редактиране

 
Геометрията дава възможност за създаване на по-ефективни алгоритми за решаване на линейни уравнения. Схемата показва триизмерно изображение на функцията f.
 
Схема на хоризонталите на функцията f. Червената и зелената отсечка показват пътя на приблизително решение, което се извършва с две итерации в двуизмерния случай.

Геометричната интерпретация на системите линейни уравнения дава допълнителна информация за техния характер. Изображението на линейния оператор a образува векторно подпространство, подобно на равнината в триизмерното пространство. Ядрото на a (векторите от дефиниционното множество, чието изображение е нулевият вектор) също е подпространство. Тези резултати показват, че множестовото от решенията образува афинно пространство.

Този подход дава възможност за създаване на алгоритми за решение, които отчитат характерните особености на a. В някои частни случаи съществуват методи, позволяващи по-бързото намиране на решение, отколкото чрез метода на Гаус. Например, възможно е да не се търси пряко решение на уравнението a.x + b = 0, а да се отговори на друг въпрос, привидно по-сложен – да се намери екстремума на f(x), дефинирана като:

Този екстремум е и решението на системата линейни уравнения. За да се разбере методът на решение, най-просто е да се разгледа случаят с две измерения – графиката на f има овална форма, както е показано на схемата вляво. Ако се тръгне от произволна точка x0 и се следва кривата с най-голям наклон (показана като червена парабола на схемата вляво и като червена отсечка на схемата вдясно), най-високата точка се означава като x1. От точка x1 отново се следва кривата с най-голям наклон, показана в зелено на схемите. Този алгоритъм се нарича метод на най-бързото изкачване. Ако вместо да се следва точно пътя на най-големия наклон, се избере посока, ортогонална на предходните посоки, методът дава решение за максимум n стъпки, където n е броят на измеренията на E.

 
Коничните сечения са криви, представляващи сечение на кръгов конус и равнина

В евклидовата геометрия е възможно всяка точка от пространството да се съпоставят определени координати, например чрез използването на ортонормален базис. Този подход дава възможност геометричните фигури да бъдат описвани с помощта на уравнения. Така например, равнина в триизмерното пространство може да се опише като съвкупността от решенията на уравнение от вида a.x + b.y + c.z + d = 0, където a, b, c и d са реални числа, а неизвестните x, y и z са координатите на точките от равнината в избраната координатна система. Числата a, b и c са координати на вектор, перпендикулярен на описваната от уравнението равнина. Правата се дефинира като сечение на две равнини и може да се опише като съвкупността от решенията на линейно уравнение със стойности в ℝ2 или на система от две линейни уравнения със стойности в ℝ, където ℝ е множеството на реалните числа.

Коничните сечения представляват сечения на конус с уравнение x2 + y2 = z2 и равнина – в пространството всяко конично сечение се дефинира като множеството от точки, чиито координати са решения на уравнение на равнина и на посоченото уравнение. Тази форма дава възможност да се определи положението и свойствата на фокусите на коничните сечения.

 
Декартовото уравнение на окръжността дава възможност за проста демонстрация на теоремата на Талес

С използването на този подход могат да се получат и уравнения, чиято цел не е изразяването на решения, подобни на току-що описаните. Пример за това е теоремата на Талес, според която един триъгълник е правоъгълен, ако една от страните му е диаметър на описаната около него окръжност. При подходящ избор на правоъгълна координатна система уравнението на окръжността може да се опише като: x2 + y2 = 1, а точките A и C на схемата вдясно имат координати съответно (-1,0) и (1,0). Ако AB е перпендикулярна на CB, съответните вектори също трябва да са ортогонални. Така с помощта на уравнението на окръжността е лесно да се покаже верността на теоремата:

Използването на уравнения дава нови възможности за разрешаване на геометрични задачи. С превръщането на геометричните фигури в уравнения декартовата координатна система преобразува геометричната задача в аналитична, откъдето идва и наименованието на цялата математическа дисциплина – аналитична геометрия. Този подход, демонстриран от Рене Декарт, обогатява и напълно преобразява известната от Античността геометрия.

В наши дни аналитичната геометрия е активно развиващ се клон на математиката. В нейната основа продължава да бъде използването на уравнения за описване на геометрични обекти, но тя прилага и по-сложни методи, базирани на функционалния анализ и линейната алгебра.

Представянето на геометрични фигури като уравнения обикновено става по един от два основни метода. При първия се използва уравнение от вида f(x) = 0, където f е функция от евклидовото пространство E с размерност n в ℝd, а d е естествено число, по-малко от n. Ако f е достатъчно правилна функция, n – d е размерността на геометричната фигура – ако тя е 1, фигурата е крива, при 2 тя е повърхнина и т.н. Такова уравнение може да се представи и като система от d уравнения с реални корени. Този вид уравнения се наричат декартови, ако x е представено чрез координати в декартова координатна система. Всички уравнения в предходния раздел са декартови.

Другият често използван метод се състои в описването на геометричните фигури с помощта на функция f от ℝd в E по такъв начин, че една точка m в E е елемент на фигурата, когато съществува точка x в дефиниционното множество на функцията f, за която f(x) е равно на m. В този случай и при достатъчна правилност на f описаната фигура има размерност d, а уравнението се нарича параметрично. Например, единичната окръжност може да се опише с параметъра θ и параметричните уравнения:

Ако описваната фигура е достатъчно правилна, например, ако поне локално съответства на дадено многообразие, то е възможно тя да се параметризира. В този контекст локално означава, че ако m е елемент на фигурата, съществува функция f и околност V на точка от дефиниционното множество f, такава че изображението на f остава част от фигурата и такова че изображението на V от f е околност на m във фигурата.

 
След многовековни усилия на математическата общност Давид Хилберт пръв успява да намери решение на диофантовото уравнение от втора степен

В исторически план първите формализирани уравнения имат аритметичен характер и датират от 3 век.[10] Ако решението на дадено уравнение се търси не като произволно число, а като цяло число, и ако уравнението е с цели коефициенти, то се нарича диофантово.[11] Описаните по-горе методи по принцип не са достатъчни за решаването на тази група уравнения, за сметка на това са изключително полезни методите на аритметиката. Относително прост пример е линейното диофантово уравнение с две неизвестни a.x + b.y = c.

С увеличаването на степента на диофантовото уравнение решаването му става далеч по-сложно. Дори уравнението от втора степен далеч не е просто в общия случай (вижте например Теорема на Ферма-Ойлер или Уравнение на Пел). Чрез използването на специално създадени за тази цел методи и предпоставки, като метода на безкрайното спускане и малката теорема на Ферма, става възможно да се решат някои частни случаи.

Общото решение на уравнението от втора степен изисква използването на по-сложни методи, като тези на алгебричната теория на числата. Необходими са по-детайлни представи за числовите множества и изследване на крайни полета и цели алгебрични числа с помощта на теорията на Галоа. Така докато решение на алгебричното уравнение от втора степен е намерено от Хорезми още през 8 век, аналогичното диофантово уравнение е решено едва в края на 19 век от Давид Хилберт. Анализът на диофантовите уравнения често е толкова сложен, че се ограничава до определянето на съществуването на решения и техния брой.

Диофантовите уравнения намират широко приложение в областта на информатиката. Инструменти, основани на техния анализ, дават възможност за откриване и поправяне на грешки и са в основата на алгоритмите на криптологията. В основата на много шифри стоят диофантови уравнения, които се описват просто, но чието решаване изисква практически недостижимо време за обработка. Например, уравнението n = x.y, където n е фиксирано естествено число, а x и y са неизвестните, не може да се реши практически, ако n е произведение на две достатъчно големи прости числа. Това уравнение е основата на популярния алгоритъм за шифриране RSA.[12]

Алгебрично число е число, което е решение на ненулево полиномно уравнение с една променлива и рационални коефициенти (или еквивалентно – чрез изчистване на знаменатели – с целочислени коефициенти). Числа като пи, които не са алгебрични, се казва, че са трансцендентни. Почти всички реални и комплексни числа са трансцендентни.

Алгебраичната геометрия е клон на математиката, изучаващ решенията на полиномни уравнения. Съвременната алгебраична геометрия се основава на по-абстрактни техники на абстрактната алгебра, особено на комутативната алгебра, с езика и проблемите на геометрията.

Основните обекти на изследване в алгебраичната геометрия са алгебраични разновидности, които са геометрични прояви на решения на системи от полиномични уравнения. Примери за най-изследваните класове на алгебрични разновидности са: равнинни алгебрични криви, които включват линии, кръгове, параболи, елипси, хиперболи, кубични криви като елиптични криви, и криви от четвърта степен като лемнискати и овали на Касини. Точка в равнината принадлежи на алгебраична крива, ако нейните координати удовлетворяват дадено полиномно уравнение. Основните въпроси на алгебричната геометрия включват изследване на точките от особен интерес като сингуларни точки, инфлексни точки и безкрайно отдалечени точки. По-сложните въпроси включват топологията на кривата и отношенията между кривите, дадени от различни уравнения.

  1. Robert Recorde // www-gap.dcs.st-and.ac.uk. School of Mathematics and Statistics, University of St Andrews, Scotland, 2002. Посетен на 5 юли 2011. (на английски) Архив на оригинала от 2013-04-15 в Wayback Machine.
  2. Marcus, Solomon и др. What is an Equation? // . Посетен на 2019-02-27.
  3. Lachaud, Gilles. Équation, mathématique // Encyclopædia Universalis. Encyclopædia Universalis, 2011. Посетен на 5 юли 2011. (на френски)
  4. Rosen, Frederic (ed.). The algebra of Mohammed ben Musa. London, Oriental Translation Fund, 1831. p. 104. (на английски)
  5. Guichard, J. P. Viète inventeur de l'algèbre nouvelle // CultureMATH. cc-parthenay.fr, 2007. Архивиран от оригинала на 2009-05-14. Посетен на 6 юли 2011. (на френски)
  6. Vandebrouck, F. Introduction de la notion de paramètre au lycée avec un logiciel de géométrie dynamique ou une calculatrice graphique (PDF) // univ-irem.fr. univ-irem.fr, 2011. Архивиран от оригинала на 2013-10-04. Посетен на 6 юли 2011. (на френски)
  7. Freguglia, P. Sur la théorie des équations algébriques entre le XVI et le XVIIème siècle // Bollettino di storia delle scienze matematiche 14 (2). 1994. p. 259 – 298. (на френски)
  8. Méthode du pivot de Gauss // La BibM@th. La BibM@th, 2011. Архивиран от оригинала на 2013-10-04. Посетен на 7 юли 2011. (на френски)
  9. Chemla, K. et al. Les neuf chapitres: le classique mathématique de la Chine ancienne et ses commentaires. Paris, Dunod, 2004. ISBN 2100077783. (на френски)
  10. XII. La première inconnue… (PDF) // irem.univ-poitiers.fr. IREM de Poitiers, 2012. p. 27. Посетен на 6 ноември 2012. (на френски)
  11. Dieudonné, Jean. Abrégé d'histoire des mathématiques, 1700 – 1900. 1986. p. 227. (на френски)
  12. Rivest, R. et al. A Method for Obtaining Digital Signatures and Public-Key Cryptosystems // Communications of the ACM 21 (2). 1978. p. 120 – 126. Архивиран от оригинала на 2007-01-27. Посетен на 2012-11-06. (на английски)