Какова роль смещения в нейронных сетях?

Я знаю о градиентном спуске и алгоритме обратного распространения. Чего я не понимаю, так это когда важно использовать предвзятость и как вы ее используете? Например, при отображении ANDфункции, когда я использую 2 входа и 1 выход, она не дает правильных весов, однако, когда я использую 3 входа (1...