← Portfolio
Ανεξάρτητη Έρευνα · Μάρτιος 2026

Bootstrap Efficiency Model —
222K Companies, UK

Πρώτη επικύρωση του BEM σε 5,6 εκατ. UK εταιρείες: οι bootstrapped επιχειρήσεις επιβιώνουν +6,4pp περισσότερο, σταθερά σε 7 χρονικά παράθυρα.

Ανεξάρτητη Έρευνα Επίσημο Μητρώο Εταιρειών UK · 222.025 εταιρείες 3 ερευνητικές υποθέσεις — και οι 3 επιβεβαιώθηκαν Στατιστικό μοντέλο με έλεγχο αξιοπιστίας Μάρτιος 2026
5.6M
UK Company
Records
222K
Analytic
Sample
+6.4pp
Survival
Advantage
+25.8pp
Threshold
Discrimination
7
Cohort Windows
p<0.001 All
Σύνοψη — για recruiters
Ποσοτικός Ερευνητής & Data Scientist · Startup Economics · Administrative Data · 2026
Σχεδίασα και επικύρωσα ένα νέο metric (BEM) για την αποδοτικότητα bootstrapped startups σε 5,6 εκατ. UK εταιρείες. Τρεις υποθέσεις, όλες στατιστικά σημαντικές.
ΚΥΡΙΑ ΕΥΡΗΜΑΤΑ +6.4pp survival advantage (stable across 7 windows) · suppressor effect confirmed (shift +0.616) · efficiency threshold discriminates survival by +25.8pp.
L2 Logistic Regression Bootstrap CIs · 5-fold CV Python · pandas · scikit-learn Suppressor Diagnostics Administrative Data Analysis
Βασικά Ευρήματα

Τα bootstrapped startups — χρηματοδοτούμενα μόνο από κεφάλαιο ιδρυτών — παραμένουν ελάχιστα μελετημένα. Το Bootstrap Efficiency Model (BEM) ποσοτικοποιεί την αποδοτικότητά τους· εδώ επικυρώνεται για πρώτη φορά σε διοικητικά δεδομένα: το πλήρες μητρώο Companies House της 1ης Απριλίου 2026 (5.696.442 εγγραφές, cohort 2001–2010, δείγμα N=222.025).

H1 ✓ Confirmed
Efficiency Advantage
Bootstrapped ventures show higher BEM efficiency and survival probability than funded counterparts.
r = 0.636 [0.634–0.639] · d = 0.326 (efficiency) · d = 0.703 (survival) · large effect
H2 ✓ Confirmed
Suppressor Effect
Bootstrapped status predicts acquisition positively once financing is controlled — reversing the negative raw correlation.
Univariate β = −0.164 → Multivariate β = +0.452 · Shift = +0.616 · OR = 1.57
H3 ✓ Confirmed
Efficiency Threshold
An efficiency threshold Ec exists above which survival is substantially higher — an actionable screening criterion for founders.
Ec = 7.19 (combined) → +25.8pp · Ec = 11.97 (boot-only) → +5.5pp · Robust under 5-fold CV
The Suppressor Effect (H2)
Sign reversal after controlling for financing — MacKinnon three-condition test

Bootstrapped firms έχουν χαμηλότερο raw acquisition rate αλλά σημαντικά υψηλότερο conditional rate αφού ελεγχθεί ο financing volume — δηλαδή, η χρηματοδότηση έκρυβε το πραγματικό πλεονέκτημα.

Οπτικοποίηση μετατόπισης συντελεστή
Univariate β
−0.164
↓ add log_funding suppressor
Multivariate β
+0.452
Μετατόπιση συντελεστή = +0,616 (OR = 1,57) — ανεπηρέαστη από τη δομική συγγραμμικότητα (r ≈ −0,75) μεταξύ bootstrapped_flag και log_funding. Ο financing volume επιτρέπει εξαγορές αλλά αποκρύπτει το ποιοτικό σήμα της lean λειτουργίας.
Συνθήκη Ορισμός Track A Track B
C1 β̂boot > 0 in multivariate +0.655 ✓ +0.452 ✓
C2 Ακατέργαστο ποσοστό boot < χρηματοδοτούμενων 82.1% > 75.5% ✗ 49.4% < 53.4% ✓
C3 β̂fund > 0 +0.717 ✓ +0.240 ✓
Και οι 3 συνθήκες Suppressor επιβεβαιώθηκε NO ✗ YES ✓
Cohort Robustness
H1 stable across 7 independent windows — spanning dot-com recovery through 2008 crisis
1999–2008
0.634
+6.8pp
2000–2009
0.635
+6.6pp
2001–2010 ⋆
0.636
+6.6pp
2002–2011
0.636
+6.7pp
2003–2012
0.638
+6.8pp
1998–2012 ext.
0.636
+6.6pp
2000–2015 long
0.636
+6.6pp

r = Mann–Whitney rank-biserial correlation, Δ = boot−funded survival gap. Όλα τα παράθυρα p < 0,001 — εύρος r 0,634–0,638 αποκλείει period-specific artifacts, ακόμη και την κρίση 2008–2009. Με απλά λόγια: το αποτέλεσμα δεν εξαρτάται από ποια χρόνια εξετάζεις.

Contributions
C1 · Administrative Validation
Πρώτη large-scale δοκιμή BEM σε υποχρεωτικά δεδομένα
N = 222.025, νομικά υποχρεωτικές καταχωρήσεις — χωρίς selection bias επενδυτικής προσοχής.
C2 · Scale & Robustness
7 ανεξάρτητα χρονικά παράθυρα επιβεβαιωμένα
Σταθερότητα σε παράθυρα 1998–2015 αποκλείει τεχνητά εποχικά αποτελέσματα.
C3 · Επέκταση σε Επιβίωση
Επέκταση BEM πέρα από εξαγορές
Επιβίωση ως κύριο αποτέλεσμα, με μεγαλύτερα effect sizes (d = 0,754) από το πλαίσιο εξαγορών.
C4 · Αναπαραγωγή Suppressor
Μετατόπιση συντελεστή ως μέτρο μεγέθους
Μεθοδολογική συνεισφορά για διοικητικά δεδομένα όπου δυαδικοί δείκτες ορίζονται από συσχετιζόμενα πεδία.
Practical Implications
Investors
Raw acquisition rates underestimate bootstrapped firm quality. Due-diligence should weight survival resilience (+6.6pp, stable across 7 windows) alongside acquisition options.
Founders
The efficiency threshold (Ec = 7.19 combined · Ec = 11.97 bootstrap-only) gives an empirically grounded screening criterion for your venture's position.
Policy
Support programmes for bootstrapped firms shouldn't benchmark success against funded firms without accounting for financing structure — the direct survival advantage (+6.6pp) implies positive externalities per pound of public support.
Doc
Model, Equations & Full Methodology
BEM formula · dual-track design · full pipeline specification
Technical documentation, kept in English regardless of page language. Statistical and modelling detail for readers with a quantitative background — skip ahead to "Contributions" if you just want the takeaways.
The BEM — Core Metric

The BEM decomposes efficiency into a value-to-cost ratio scaled by digital leverage. Designed for administrative-data contexts: requires only sector classification, company age, account category, and charge counts.

Core BEM Efficiency Metric — eq. 4
$$E = \frac{R \cdot \text{LTV}}{\text{CAC} \cdot \text{OE}} (1 + D)$$
R = revenue proxy (SIC prefix — the UK's Standard Industrial Classification code for business sector) · LTV = customer lifetime value (age) · CAC = acquisition cost (account category) · OE = operating expense (mortgage charges) · D = digital adoption (SIC-assigned: 0.80 high-tech / 0.15 traditional). Range: approx. 7–75 in CH data.
Bootstrapped Definition — eq. 1
$$TC_t \leq PC + \sum_{i=0}^{t-1} \pi_i + MD_t, \quad MD_t < 0.1 \cdot TC_t$$
Operationalised in CH data as: NumMortCharges = 0 (no registered mortgage/charge instruments) + active account filing + ConfStmt within 3 years. Three-condition filter guards against dormant shell contamination.
Outcome Probability — eq. 6
$$P(\text{outcome} \mid x) = \sigma\!\left(\alpha_0 + \alpha_1 \log E + \alpha_2 \log \text{age} + \alpha_3 \log \text{fund} + \alpha_4 b + \sum_k \alpha_k X_k\right)$$
Track A: P(Survive) — α₃ negative (debt obligations increase failure risk). Track B: P(AcqProxy) — α₃ positive (financing enables holding-structure outcomes, precondition for suppressor).
Dual-Track Design

The Companies House registry does not record M&A events directly. We adopted a dual-track design to test all three hypotheses within a single dataset. Model quality below is reported as AUC (how well the model separates the two outcomes — 0.5 = random guessing, 1.0 = perfect prediction), checked via 5-fold CV (the data is split 5 ways and tested on each split in turn, to confirm the score isn't a fluke of one split).

Track A — Survival
0.621
AUC · 5-fold CV: 0.624 ± 0.004
Active vs. Dissolved
N = 222,025 (boot = 150,633 / funded = 71,392). Success rate 80.0%. Tests H1 & H3. Boot survival 82.1% vs funded 75.5% — direct +6.4pp advantage.
Track B — Acquisition Proxy
0.670
AUC · 5-fold CV: 0.668 ± 0.002
SIC 64x/70x vs. Dissolved
N = 40,670 (≈ 1:1 balance). Tests H2 (suppressor). Operating companies migrate to holding structures upon acquisition. Sufficient for sign-reversal test.
Full Pipeline Specification
Dataset
Companies House Free Data Products · BasicCompanyDataAsOneFile-2026-04-01.csv · 5,696,442 records · 2,792 MB
Time window
2001–2010 incorporation · ≥15 years observable outcomes. Reduces pre-2001 imbalance from 13:1 to manageable 11.6:1 (capped 4:1).
Bootstrapped Proxy
3-condition filter: (1) NumMortCharges = 0 · (2) AccountCategory ∈ {MICRO, FULL, SMALL, …} · (3) ConfStmtLastMadeUpDate within 3 years
Model
L2-regularised logistic regression · C selected by 5-fold inner CV from {0.01, 0.1, 1.0, 10.0} · Stratified 80/20 train/test split
Bootstrap CIs
1,000-iteration bootstrap 95% confidence intervals for all effect sizes · Mann–Whitney U tests
Suppressor Diagnostic
MacKinnon et al. (2000) three-condition test · VIF (variance inflation factor — checks whether predictor variables overlap with each other) < 10 confirmed for all retained features (max Track A: 3.2 · Track B: 2.5)
Imbalance Handling
Majority-class undersampling at 4:1 cap · No class weighting (empirically better calibration at this ratio)
Doc
Limitations & Future Research
Honest assessment — 5 points
L1
Proxy validity: BEM scores use researcher-calibrated SIC proxies, not direct P&L observations. Direct validation via CH Accounts Data is the highest-priority future extension.
L10
Structural collinearity: NumMortCharges = 0 definitionally determines bootstrapped status, making bootstrapped_flag and log_funding near-collinear (r ≈ −0.75). Coefficient shift is introduced as an alternative inferential measure.
L4
UK only: Offset by N = 222K and absence of selection bias. Future extension to Germany (Handelsregister), Scandinavia and international replication.
L5
Static snapshot: A single Companies House snapshot. Annual snapshots would enable longitudinal BEM trajectory analysis over the company lifecycle.
L6
Causal identification: Observational study. Quasi-experimental extensions: broadband rollout geography as an IV (instrumental variable, used to isolate a causal effect) · EIS (Enterprise Investment Scheme — a UK tax-relief scheme for investors in early-stage companies) eligibility thresholds for RDD (regression discontinuity design, comparing firms just above/below a cutoff) analysis.

Αυτή η μελέτη δείχνει ότι τα διοικητικά δεδομένα, όταν χρησιμοποιηθούν σωστά, μπορούν να παράγουν εμπειρικά στοιχεία μεγάλης κλίμακας για την απόδοση bootstrapped επιχειρήσεων — μιας κατηγορίας που απουσιάζει συστηματικά από τις βάσεις δεδομένων που χρησιμοποιεί η υπόλοιπη έρευνα. Τα κεντρικά ευρήματα επαληθεύονται σε δύο διαφορετικά αποτελέσματα, επτά χρονικά παράθυρα. Ο πλήρης κώδικας είναι ανοιχτός.

Spilios Dimakopoulos · Ανεξάρτητος Ερευνητής · Μάρτιος 2026
✓ COPIED