главная новое лучшее написать
неделя месяц год вечное
посты пользователи ответы
4

Ну это, та самая штучка, в общем, вы поняли

ШОК! Мир модели GPT крутится вокруг религии, астрономии, математики и психологии.

Для проверки достаем модель GPT-2-S, которую можно запустить на CPU, и подставляем вместо <default_token> - усредненный токен (арифметический либо медианный):

Вообще это очень похоже на направление, которое год назад нащупали в статье "SolidGoldMagikarp" с lesswrong про GPT-2.

В копилку аргументов Андрея хочу добавить следующие:

1 ответ
7

Я читал его годами и, хотя не знал его лично, знаю, что он был одним из лучших исторических блогеров, а также крайне разносторонним и интересным человеком. Очень жаль, что он ушел из жизни так рано.

Вот кое-что из того, что Андрей писал на Кью (чтобы не уподобляться robot-reposter'у, эти примеры я отобрал вручную).
- Правда ли, что пираты закрывали глаз повязкой из чисто практических соображений — лучше видеть в темноте трюма?
- Когда началось и кончилось средневековье?
- Миф о "праве первой ночи"
- Пара слов о сложностях Конкисты
- До какого возраста в Средневековье люди доживали в среднем?

ответить
4

Среди нас наверняка есть аркадии с высшим образованием в районе физики.

Накидайте примерно, как вы видите путь к доказательство AdF/CFT для 4-мерного пространства-времени?
И в чём там затык, почему так долго нет? //вроде один из самых важных кусочков паззла на пути к примирению квантов и ОТО

from #yachan

1 ответ
4

Проблема: локальные virtualenv'ы для ML-проектов жрут до хрена места, но при этом часто имеют очень много дублирующегося контента.
В моём случае 4 простеньких проекта сходу съедают 21 GB.

$ du -hs ~/.pyenv/versions/*/envs/*
7.6G    /home/rutsh/.pyenv/versions/3.11.11/envs/ASpanFormer
6.0G    /home/rutsh/.pyenv/versions/3.11.11/envs/LightGlue
502M    /home/rutsh/.pyenv/versions/3.11.11/envs/Navigation
5.8G    /home/rutsh/.pyenv/versions/3.11.11/envs/yolo

Хочется как-то более-менее просто дубликаты найти и хардлинками связать друг с другом.

Решение: утилита rdfind уже умеет всё автоматически разрешать - https://github.com/pauldreik/rdfind
В моём случае запуск "rdfind -makehardlinks true /data/pyenv_versions/" превратил 21 GB в 8.7 GB!

Пользуйтесь!!!

Tags: #tools

ответить
7

Улучшения

Важное изменение в правилах

Единственное правило, объявленное на старте сервиса, отменяется, поскольку многие понимают его слишком расширительно. Спасибо, что вы отнеслись к площадке бережно, это очень трогательно.

Никаких ограничений на темы нет. Никакие "модели угроз" в голове строить не нужно. Не заморачивайтесь. Если вы всё равно сомневаетесь, можете откалибровать свою интуицию на примере типичного контента из ЖЖ или из Двача: эти сервисы живут и в ус не дуют.

Для создания дополнительного уюта внизу каждой страницы теперь живёт канарейка.

Правила могут появиться в будущем. Например, если кто-нибудь начнет активно топить за Гитлера, нас могут забанить сразу в нескольких странах, поэтому правило "не топить активно за Гитлера" может в какой-то момент быть формализовано и начать обеспечиваться модерацией. Но будем придерживаться принципа "решать проблемы по мере их поступления".

1 ответ
4

Ссылка на задачу — 2551. Put Marbles in Bags.

📌 Описание задачи

💡 Идея

При разбиении на k подряд идущих мешков мы делаем k - 1 разрез между кусками.
Каждый разрез влияет на итоговую сумму добавлением пары вида weights[i] + weights[i+1],
где i — индекс последнего элемента в предыдущем мешке.

explanation.png

Следовательно, вся задача сводится к выбору k - 1 пар соседних кусков, которые:

Читать дальше →

ответить
4

Ссылка на задачу — 2780. Minimum Index of a Valid Split.

📘 Описание задачи

💡 Идея

Для эффективного поиска доминирующего элемента хорошо подходит алгоритм большинства голосов Бойера — Мура.
Зная доминирующий элемент, можно пройти по массиву и в каждой возможной точке разделения отслеживать:

🔍 Детали подхода

  1. Применяем алгоритм голосования большинства для нахождения доминанты.
  2. Подсчитываем точное количество его вхождений, чтобы использовать для отслеживания остатка справа.

Читать дальше →

ответить
4

Посоветуйте, пожалуйста, короткие фантастические рассказы. Очень люблю этот жанр, особенно, перед сном.

Со своей стороны, предложу«Индетерминированный ключ» (The Laxian Key ) Шекли.

7 ответов
6

Отсюда: https://www.reddit.com/r/slatestarcodex/comments/9rvroo/most_of_what_you_read_on_the_internet_is_written/

...1000 самых активных пользователей Википедии — 0,003% ее пользователей — вносят около двух третей правок.

...167 113 рецензий на книги Amazon были написаны всего несколькими рецензентами из "топ-100"; самый плодовитый рецензент написал 12 423 рецензии. Как кто—то может написать столько рецензий — не говоря уже о том, чтобы прочитать столько книг, - выше моего понимания.

... я нашел одного рецензента с 20,8 тыс. отзывов с 2011 года. Это чуть меньше 3000 отзывов в год, то есть около 8 в день. Этот человек писал в среднем по 8 отзывов на книги на Amazon в день, каждый день в течение семи лет. Я подумал, что это может быть какой-нибудь бот-аккаунт, пишущий поддельные отзывы в обмен на деньги, но если это так, то это действительно хороший бот, потому что Грейди Харп - реальный человек, чья работа соответствует описанию этого аккаунта. И когда я просмотрел несколько отзывов, мне показалось, что все они имеют отношение к книге, и на всех них у него есть пометка "подтвержденная покупка", что также означает, что он, вероятно, действительно их читает.

Единственное объяснение такого поведения в том, что он сумасшедший. Я имею в виду, нормальные люди так не поступают. Мы читаем максимум 20 книг в год и, вероятно, не на все из них пишем рецензии на Amazon. С этим парнем, должно быть, что-то не так.

То же самое относится и к другим веб-сайтам. Один из опытных пользователей Википедии, Джастин Нэпп, с момента регистрации в 2005 году по состоянию на 2012 год вносил в среднем 385 правок в день. Предполагая, что он не спит, не ест и ничего больше не делает (на данный момент моя лучшая гипотеза), это по-прежнему одна правка каждые четыре минуты. Он тоже не сбавил темп; он сделал свою миллионную правку после семи лет редактирования и приближается к своей двухмиллионной сейчас, через 13 лет. Этот человек редактирует статью в Википедии каждые четыре минуты в течение 13 лет. Он сумасшедший, и он оказал огромное влияние на то, что мы с вами читаем каждый день, когда нам нужно больше информации буквально о чем угодно. И он такой не один; есть пользователь с 2,7 миллионами правок и многие другие с более чем миллионом. Обратите внимание, что некоторые из них присоединились позже, чем Кнапп, и поэтому могут иметь более высокую частоту правок, но мне не хочется подсчитывать это.

Стример Twitch Тайлер Блевинс (Ninja) снимает, как он играет в видеоигры по 12 часов в день. "Расписание таково: я начинаю в 9:30 утра, а потом играю до 4, так что это примерно шесть-шесть с половиной часов”, - говорит Блевинс. “Затем я делаю приятный трех-четырехчасовой перерыв с женой, собаками или семьей - у нас тоже бывают семейные вечера — а затем возвращаюсь примерно в 7 часов вечера примерно до 2-3 часов ночи. Минимум 12 часов в сутки, и шесть-семь часов на сон, или меньше”.

И он занимается этим с 2011 года, хотя начал зарабатывать большие деньги только недавно.

Читать дальше →

2 ответа
3

4 ответа
3

Итак, думаю этот hot take будет прям hot.
Тезис: современная этика в науке и медицине очень сильно ограничивает прогресс. Смягчение некоторых этических норм позволит очень сильно продвинуть прогресс вперед. Предлагаемые изменения в этике:
- все что делается с информированного добровольного согласия дееспособного человека - допустимо
- любые научные эксперименты на животных допустимы
- запреты на клонирование и генетические модификации человека отменяются

Примеры и аргументы почему да:
- медицина: даже на смертельно больном пациенте провести авантюрное лечение по принципу "ну 1% что поможет, 99% что умрет - так ведь и так умрет" не получится просто взять и применить. Даже при его информированном согласии.
- наука: опыты на животных - боль. Нужно 50 одобрений; хрен вам(в смысле мыши) а не шимпанзе, комитет по этике против; на человеческих эмбрионах что-то делать это вообще бюрократический ад. И да, мыши от человека сильно дальше чем шимпанзе - талидомид например для них не тератоген как для нас, а вот для нас и шимпанзе да. В итоге, воспроизводимость исследований на людях страдает, мы проводим 10 тестов на мышах, а на 11ом на шимпанзе понимаем что занимались изначально обреченной идеей.
- Клонирование человека + генетические модификации - путь к истребелению множества наследственных заболеваний. Как вам мир в котором "синдром дауна" и "спинально-мышечная атрофия" - это какие-то понятия из прошлого?

18 ответов
4

Сегодня мы решаем задачу 2924. Find Champion II

🏆 Задача:

В турнире n команд представлены как вершины DAG (ориентированного ацикличного графа). Если команда a сильнее команды b, это отображается направленным ребром от a к b. Требуется найти чемпиона турнира — вершину, из которой достижимы все остальные вершины. Если чемпиона нет или их несколько, вернуть −1.

😊 Идея:

В DAG вершина с отсутствующими входящими рёбрами (in_degree = 0) является источником. Если в графе ровно один источник, он становится кандидатом в чемпионы, так как из него достижимы все остальные вершины
(Нетривиальный момент: это утверждение не верно в общем случе, но в случае DAG его несложно доказать).
Если источников больше или ни одного, чемпиона не существует.

Сложность

Исходный код решения

impl Solution {
    pub fn find_champion(n: i32, edges: Vec<Vec<i32>>) -> i32 {
        let mut in_degree = vec![0; n as usize];

        // Calculate in-degrees for each node
        for e in &edges {
            in_degree[e[1] as usize] += 1;
        }

        // Identify the potential champion
        let mut champion = -1;
        let mut n_champions = 0;

        for (node, &degree) in in_degree.iter().enumerate() {
            if degree == 0 {
                champion = node as i32;
                n_champions += 1;
            }
        }

        // There must be exactly one node with in-degree 0
        if n_champions == 1 {
            champion
        } else {
            -1
        }
    }
}

1 ответ
6

На днях попробовал делать ставки на рынке предсказаний (на реальные деньги), делюсь впечатлениями.

ответить
4

Сегодня у нас еще одна задача на аккуратное манипулирование индексами 2337. Move Pieces to Obtain a String.

Описание задачи

Даны две строки start и target длины n, содержащие символы 'L', 'R' и '_'.

Идея 🧠

Задача сводится к тому, чтобы проверить, совпадают ли позиции и направления символов 'L' и 'R' в двух строках с учётом их ограничений на движение. Мы используем итерацию по строкам одновременно, отслеживая доступные символы 'L' и 'R' через счётчики.

Подход 🛠️

  1. Используем метод as_bytes(), чтобы быстро перебрать символы в виде байтов.
  2. Одновременно проходим по обеим строкам:
    • Если видим 'L' в target, увеличиваем счётчик доступных 'L'.
    • Если видим 'L' в start, проверяем, есть ли доступный 'L', и уменьшаем счётчик.

Читать дальше →

2 ответа
6

По-моему, это многое объясняет.

Отсюда

Когда Си Цзиньпин впервые вошел в Постоянный комитет Политбюро в 2008 году, восемь из девяти его членов были инженерами. Верховный лидер Ху Цзиньтао был специалистом по проектированию гидроэлектростанций. Его заместитель Вэнь Цзябао был инженером-геологом. В составе также было два инженера-электрика, инженер-нефтяник, радиоинженер и два инженера-химика (включая самого Си Цзиньпина). Единственным неинженером был Ли Кэцян, экономист.

И на самом деле с точки зрения доминирования инженеров в китайской власти это была невысокая точка. В предыдущем составе 100% чиновников Постоянного комитета Политбюро были инженерами! Что вообще происходит?

Во-первых, Дэн Сяопин считал инженеров крутыми, и он был достаточно могущественен, чтобы делать все, что ему заблагорассудится. Правительство, полностью состоящее из инженеров? Конечно, как скажете. А поскольку высшие эшелоны китайского правительства сами назначают своих преемников, эти инженеры могли назначать других инженеров и так далее.

Но кроме того, во время Культурной революции около половины китайцев, которые вообще получили высшее образование, получили инженерное. Образование, мягко говоря, не было сильной стороной Культурной революции. Но инженерное дело было полезно для строительства заводов, и поэтому его неохотно терпели. Это означало, что из людей, достаточно умных и амбициозных, чтобы вообще поступить в колледж, половина занималась инженерным делом.

(гм, а это разве слишком много? - finder)

ответить
4

Но и постов давно не было. Не уверен, что получилось коммьюнити :-(

4 ответа
4

Сегодня нам предстоит решить задачу 2577. Minimum Time to Visit a Cell In a Grid.

📝 Описание задачи

💡 Идея

Задача сводится к поиску кратчайшего пути с учётом времени открытия ворот в каждой ячейке. Можно представить задачу как динамический граф, где вершины — это пары (время, ячейка), а рёбра — это возможные переходы между ячейками. Вместо того чтобы хранить весь граф, мы динамически вычисляем возможные переходы из посещаемых вершин. Вершины будем перебирать в порядке времён достижимости ячейки (как в алгоритме Дейкстры).

🔑 Подход к решению

Читать дальше →

ответить
3

Благодаря журналистам всем известно, что за возникновение массы ответсвенен бозон Хиггса.
Благодаря фантастам и не только всем известна разрушительная сила антивещества.
Всё что нужно - это объединить 2 понятия!

Антибозон Хиггса пока что остается гипотетической частицей. Но мы можем представить его потенциальное воздействие на процессы в организме, основываясь на предполагаемых свойствах и характеристиках частицы Хиггса и античастицы.

Антибозон Хиггса взаимодействует с фундаментальными частицами, такими как кварки или лептоны, и изменяет их массу. Уменьшение массы этих частиц может привести к снижению массы всего организма в целом.

Это можно сравнить с изменением веса предмета на земле и на луне: из-за различий в гравитационной силе предмет будет иметь разную массу. Аналогично, изменение массы элементарных частиц под воздействием антибозона Хиггса может привести к уменьшению общей массы организма.

7 ответов
4

Сегодня чуток похулиганим и предоставим переоптимизированное решение для задачи 2554. Maximum Number of Integers to Choose From a Range I. В реальном интервью такое могут потребовать лишь на уровне идеи, но нам интересно запрограммировать самим :)

Описание задачи 📋

Необходимо выбрать максимально возможное количество чисел из диапазона [1,n], при этом соблюдая ограничения:
- Числа из списка banned выбирать нельзя.
- Каждое число можно использовать не более одного раза.
- Сумма выбранных чисел не должна превышать maxSum.

Результатом должно быть количество чисел, которые можно выбрать, удовлетворяя этим условиям.

Идея решения 💡

Предвычисляем суммы запрещённых чисел и используем двоичный поиск, чтобы найти максимальное k, для которого сумма допустимых чисел в диапазоне [1,k] не превышает maxSum. Это позволяет эффективно учитывать ограничения и избежать лишних вычислений.

Обзор решения 🧠

  1. Сортировка и удаление дубликатов:
    • Сортируем массив banned и удаляем повторяющиеся элементы.
  2. Предвычисление кумулятивных сумм:
    • Создаем массив ban_sums, где на позиции i содержится сумма первых i запрещённых чисел. Это позволяет быстро вычислять сумму запрещённых чисел до любого предела.

Читать дальше →

ответить
6

RSS/Atom

finder, изменено 23-02-2024

Для тех, кто пользуется RSS-читалками. На notq можно подписаться так:

https://notq.ru/feed/new -- все посты

https://notq.ru/feed/upvoted -- посты выше некоторого порога по популярности

https://notq.ru/feed/u/finder -- так можно подписаться на посты конкретного пользователя

5 ответов
3

Hot Take #3

asandler2, 15-03-2024

На фоне происходящих сейчас электоральных мероприятий закину новый hot take, связанный как раз с этим процессом.

Возможна ли само-модерирущюаяся распределённая система принятия справедливых решений любой сложности и важности, способная заменить централизованную государственную власть? В каких единицах вообще выражается власть, в какой пропорции это деньги и сила, а в какой что-то ещё?

Моё мнение: хотелось бы мечтать о такой штуке, но совершенно непонятно, каким образом, кроме силового принуждения, можно заставить людей соблюдать решения, принятые даже в такой "честной" системе. Власть, с другой стороны, в моём понимании выражается как деньги + авторитет + сила (не личная, а групповая), причём авторитет (уважение, полученное за продуцирование справедливых решений) в этой сумме играет меньшую роль, чем два других слагаемых. Бедное население не может влиять на власть с помощью кошелька, поэтому и демократии среди такого населения построить не получится, какую бы доступную и честную систему принятия решений не придумать.

Когда я об этом думал, то представлял себе многоуровневую систему фильтрации идей - грубо говоря, любой может закинуть идею, а пять случайных человек её пропускают наверх или аргументированно отбивают, а другие пять случайных человек проверяют аргументы первой группы. Отфильтрованные идеи попадают уже не в пятиугольник, а в группу побольше, и там фильтруются в таком же формате, таким образом, наверх всплывают потенциально хорошие идеи.

Другая идея у меня была в назначении экспертных представителей по различным важным жизненным вопросам. Грубо говоря, я знаю несколько человек, которые точно являются специалистами в какой-то области, и могу доверить им принимать за себя решения в этой области (здравоохранение, образование, строительство, и так далее). Те люди, в свою очередь, могут или сами принимать решения с весом, равным количеству представляемых людей, или передавать их дальше, где веса будут суммироваться по такому же принципу. Получается некоторый аналог министерств, но решения принимаются на основе экспертизы, а не на основе карьерного продвижения во власти. Забавное следствие в такой системе - уважение и вес можно легко растерять, если принять непопулярное решение, так как сделанный выбор будет легко увидеть. Таким образом, голосовать выбранные представители будут более серьёзно. В целом Госдуму можно было бы организовать по такому же принципу, но политика, в отличие от экспертных областей, гораздо грязнее, и там уже работают другие законы.

9 ответов
4

Очередная задача: 2290. Minimum Obstacle Removal to Reach Corner.

📄 Описание задачи

Дана двумерная матрица grid размером m x n, где каждая клетка может быть либо пустой (0), либо препятствием (1), которое можно удалить. Задача заключается в том, чтобы найти минимальное количество препятствий, которые нужно удалить, чтобы пройти из верхнего левого угла (0, 0) в нижний правый угол (m-1, n-1), передвигаясь только по пустым клеткам или удаляя препятствия.

🔑 Идея

Для решения задачи используем модификацию алгоритма поиска в ширину (BFS), который эффективно обрабатывает препятствия. Вместо приоритизации клеток по расстоянию, как в стандартном алгоритме Дейкстры, в 0-1 BFS (именно так эту модификацию принято называть) мы обрабатываем сначала пустые клетки, а затем клетки с препятствиями, что позволяет нам минимизировать количество удаляемых препятствий.

📋 Подробное описание подхода

  1. Инициализация: Мы создаем две очереди: front и back. Во front помещаем клетки, которые можно пройти без удаления препятствий, а в back — клетки, для которых потребуется удалить препятствие.
  2. Поиск в ширину (BFS):
    • Начинаем с верхнего левого угла и устанавливаем расстояние для этой клетки в 0 (т.е. препятствий еще не удалено).
    • Если клетка пустая (значение 0), мы добавляем её в front. Если клетка — препятствие (значение 1), то в back.

Читать дальше →

ответить
4

Сегодня решаем задачу 2054. Two Best Non-Overlapping Events. Будем закреплять двоичный поиск ;)

😇 Описание задачи

Дан список событий с известными для них start_time, end_time и value. Нужно выбрать максимум два непересекающихся события с максимальной общей ценностью. События пересекаются, если одно начинается до окончания другого.

💡 Идея

Сортируем события по end_time (в убывающем порядке). Для каждого события используем двоичный поиск, чтобы найти все заканчивающиеся до его начала. Остаётся найти среди них событие с максимальной ценностью, для этого будем хранить накопленные максимальные ценности в отдельном массиве max_vals.

🛠️ Подход

  1. Сортировка событий: По end_time в порядке убывания.
  2. Предобработка максимальных ценностей: Создаём массив max_vals с накопленной максимальной ценностью событий (справа-налево).
  3. Итерация и поиск:
    • Для каждого события находим первое, заканчивающееся раньше его, через двоичный поиск.
    • Суммируем ценности текущего события и накопленной максимальной ценности по найденному индексу, обновляя общий максимум.

Читать дальше →

ответить
3

В среде ML'щиков прямо захайпились сети Колмогорова-Арнольда - https://arxiv.org/abs/2404.19756
А насколько по вашему безумная идея попробовать другие варианты апроксимации функций на рёбрах сети. Математически базис рядов Фурье вроде как лучше должен на эту задачу ложиться, нежели сплайны.

5 ответов
6

Очень интересная история, на которую я в последние месяцы натыкался уже несколько раз. TLDR: красный и зеленый светодиод сделали довольно просто, а синий после этого не могли научиться производить около 30 лет, хотя всем, кому знакома аббревиатура RGB, было ясно, что это их и отделяет от массового применения -- обычных светодиодных ламп на замену лампочкам Эдисона-Лодыгина-Ильича, гигантских рекламных экранов размером со здание, вот этого всего. В итоге материалы и техпроцесс создал один японский инженер, до этого ничем не известный, в небольшой компании, на чистой силе воли и во многом вопреки мнению окружающих.

Что мне в этом ролике ещё показалось интересным:

Читать дальше →

ответить

Страница 1 2 3 4